Department: 553 EBS Engineering
Location: Tokyo, Japan
Description
EIS is looking for a Senior Data Scientist to build machine learning models for insurance claims analysis and fraud detection. The role offers opportunities to work on advanced AI projects and grow with the expanding Japan team. Role type: 1-year full-time employment contract.
Key Responsibilities
- Improve existing supervised fraud detection models (primarily XGBoost) through feature engineering, tuning, and evaluation
- Design and implement unsupervised and semi-supervised anomaly detection models (e.g., ECOD, Isolation Forest, clustering-based approaches)
- Explore ensemble strategies combining anomaly signals, supervised scores, and business rules
- Analyze fraud patterns in FNOL (First Notice of Loss) and downstream claim lifecycle data
- Develop new model concepts for emerging fraud patterns (temporal anomalies, behavior shifts, structural inconsistencies)
- Evaluate bias, stability, and confidence of fraud scores and support threshold calibration
- Partner with engineering to productionize models in AWS + Snowflake environments
- Support customer-facing analysis and explanations, including Japanese-language discussions when needed
- Document findings, assumptions, and tradeoffs clearly for technical and non-technical audiences
Skills, Knowledge & Expertise
- 5+ years of hands-on experience in data science or applied ML, preferably in fraud, risk, or anomaly detection
- Strong experience with XGBoost (or similar tree-based models)
- Practical experience with unsupervised anomaly detection techniques
- Advanced Python skills (pandas, numpy, scikit-learn, ML pipelines)
- Experience working with large tabular datasets in production environments
- Strong SQL skills; experience querying and modeling data in Snowflake
- Familiarity with AWS (S3, IAM, compute services; SageMaker a plus)
- Fluent Japanese and English (spoken and written)
- Comfortable working with partially labeled, noisy, or evolving datasets
Nice to Have
- Experience in insurance claims, auto insurance, or financial fraud
- Experience combining supervised + unsupervised signals into composite risk scores
- Knowledge of model explainability (SHAP, feature importance analysis)
- Familiarity with data pipelines (DBT, ELT workflows)
- Experience supporting regulated or compliance-sensitive environments
- Prior work with bias/fairness analysis in ML models
Job Benefits
- Work with top talent and great colleagues who are industry and technology experts. Operate in a Scaled Agile environment, diverse, multicultural and cross-functional teams
- We are a global and modern software product company building world-class Enterprise InsurtTech Product powered by leading-edge technologies (microservices, reactive, cloud, continuous delivery)
- We offer freedom - build from building your career path through development programs and exciting global mobility opportunities (we have a remote and global culture)
- We work with the newest Apple Macbooks
*Please note that we will be proceeding only with those applications that have valid working permits in the location stated in the vacancy description.
EISでは、保険請求データの分析および不正検知のための機械学習モデルを構築するシニア・データサイエンティストを募集しています。
本ポジションでは、先進的なAIプロジェクトに携わりながら、日本チームの拡大とともに成長できる機会があります。
雇用形態: 1年間のフルタイム契約
主な業務内容
既存の教師あり不正検知モデル(主にXGBoost)の改善(特徴量エンジニアリング、チューニング、評価)
教師なしおよび半教師あり異常検知モデル(例:ECOD、Isolation Forest、クラスタリング手法)の設計および実装
異常検知シグナル、教師ありモデルのスコア、ビジネスルールを組み合わせたアンサンブル戦略の検討
FNOL(First Notice of Loss:初回事故通知)およびその後の保険請求ライフサイクルデータにおける不正パターンの分析
新たな不正パターン(時間的異常、行動変化、構造的な不整合など)に対応するモデルコンセプトの開発
不正スコアのバイアス、安定性、信頼性の評価および閾値調整のサポート
エンジニアリングチームと連携し、AWSおよびSnowflake環境でのモデルの本番運用化を推進
必要に応じて日本語での顧客向け分析・説明をサポート
技術者および非技術者の双方に向けて、調査結果・前提条件・トレードオフを明確に文書化
必須要件
データサイエンスまたは応用機械学習分野での実務経験5年以上(特に不正検知、リスク分析、異常検知の経験があれば尚可)
XGBoost(または類似のツリーベースモデル)を用いた実務経験
教師なし異常検知手法の実務経験
Pythonの高度なスキル(pandas、numpy、scikit-learn、MLパイプライン)
本番環境における大規模な表形式データセットの取り扱い経験
SQLの高いスキル、およびSnowflakeでのデータクエリ・データモデリング経験
AWS(S3、IAM、コンピュートサービスなど)に関する知識(SageMakerの経験があれば尚可)
日本語および英語での高いコミュニケーション能力(読み書き・会話)
部分的にラベル付けされたデータ、ノイズの多いデータ、または変化するデータセットを扱うことに抵抗がない方
歓迎スキル
保険請求、特に自動車保険または金融不正分野での経験
教師あり・教師なしのシグナルを組み合わせたリスクスコアリングの経験
モデルの説明可能性(SHAP、特徴量重要度分析など)の知識
データパイプライン(DBT、ELTワークフローなど)の経験
規制やコンプライアンス要件のある環境での業務経験
機械学習モデルにおけるバイアス/公平性分析の経験