【職務内容】
・内製Deep Researchの開発と評価
・Deep Researchのためのデータ合成・強化学習
・テキスト埋め込みモデルやリランキングモデルの学習
・検索用の基盤モデルの学習
・R&D用のデータ基盤や検索基盤の構築
・情報検索技術を用いたAIプロダクトやLLMエージェントのプロトタイピング
【ミッション】
・Deep ResearchおよびInformation Retrievalの研究開発
・情報検索技術を用いたAIエージェントプロダクトのプロトタイピング
・得られた成果を事業に還元し、必要に応じて論文や特許、対外発表を行う
【仕事の魅力】
検索用の小規模なモデルの学習したり、社内でスクラッチ学習した日本語LLM Sarashinaをファインチューニングしたりすることで、Deep Researchを独自に開発することを目指しています。また、検索拡張生成タスクのベンチマーク自体を新しく作るなど、情報検索やRAGの根源的なレイヤーで研究開発をすることができます。
【勤務地】
フルリモートワークも可能ですが、予め申請が必要となります。
【必須要件】
・検索システム、推薦システム、埋め込み表現、検索拡張生成のいずれかに関する専門知識
・GitHubなどのソフトウエア開発プラットフォームを使ったチームでの開発経験
・論文を読解し実装の再現、またはアルゴリズムを改変した経験
【歓迎要件】
・自然言語処理または情報検索・推薦分野での開発の経験(3年以上)
・Kaggleなどのデータサイエンスコンペでのメダル獲得経験
・大規模な検索システムもしくは推薦システムの開発・運用経験(3年以上)
・複数GPUを用いた機械学習モデルの開発経験
・国際会議での発表経験
・ローカルLLMやテキスト埋め込みモデルのファインチューニングの経験
・OSSへの貢献
・プロジェクトマネジメントの経験
・テックリードの経験