開く
情報・通信業
ストックマーク株式会社

【Dev】LLM推論基盤エンジニア(LLM新規事業)

年収:755万円

1305.8万円

東京都

正社員

求人詳細

【現状の課題】
国産LLM・VLMの自社開発を進める中で、推論・モデル軽量化などの性能最適化がボトルネックとなっています。
既存のフレームワークやGPU構成に依存しない、高速・安定・安価な基盤を構築することが急務です。
研究開発レベルの知見をプロダクトとして成立させる実装力を持つエンジニアを求めています。

【業務内容】
自社プロダクトで活用する大規模言語モデル(LLM)およびマルチモーダルモデル(VLM)の推論・学習の高速化を担当します。
製品開発チームやリサーチチームと協働しながら、実際のプロダクトに最適な形で技術を落とし込んでいただきます。

▼具体的な業務内容
・LLM/VLM推論パイプラインの最適化(高速化・省メモリ化・分散処理)
・モデル圧縮、量子化、蒸留などによる軽量化手法の検討と実装
・推論基盤の設計(モデル並列・パイプライン並列・ロードバランシング)
・推論時間・コストの定量的改善に向けた性能計測と最適化サイクルの運用

【チーム構成】
PaaSユニット
事業責任者(CEO)1名
プロダクトマネージャー 1名

【開発環境】
▼組織体制

・プロダクトマネージャー1名
・フロントエンドエンジニア1名
・バックエンドエンジニア1名
・機械学習エンジニア3名

▼開発言語
TypeScript、Vue.js 、Node.js、Python

▼コンテナ
Docker

▼IaC
Terraform

▼クラウド
AWS、Azure

【ポジションの魅力】
・国産LLMを自社でフルスクラッチ開発している希少な環境
・研究成果を“動くプロダクト”として社会に届ける技術開発ができる
・OSSや論文に還元できるほどの技術的挑戦を実務で経験可能
・LLM/VLM領域の先端研究者と密に協働できる

【勤務体系】 
・リモートワークと合わせて、時間や場所に縛られない柔軟な働き方が可能です。
・勤務時間の調整や中抜けなどで、子育てや介護との両立もしやすい環境です。

【勤務地】
▼就業場所
本社または自宅その他リモートワークが行える場所(変更の範囲なし)
※フルリモートワーク可

▼リモートワークについて
・基本的にはフルリモート体制
 ‐ フルリモートでの就業場所は、日本国内に限ります。
・本社への出社について
 - 弊社の定める通勤圏(一都三県)居住者は、リモート/出社を回数制限なく自由に使い分けながら勤務可能です。
 - 一都三県以外の居住者は、月1回業務とは関係なく自由に出社可能です。

仙台・京都・大阪などからフルリモートで働いている人、ワーケーションを楽しみながら働いている人、母国に数週間帰国して働いている外国籍社員、また出社メインの人など多様な働き方を実現しています。

募集要項

お仕事No. JN00482416
採用企業 ストックマーク株式会社
応募条件 【必須スキル】
▼いずれか必須
・PyTorchやTensorFlowなどを用いたLLM/VLMの実装・最適化経験
・CUDA、NCCL、TensorRT、ONNX Runtimeなどを活用したGPU最適化知識
・モデル推論のパフォーマンス改善・メモリ削減の実務経験
・分散学習・推論に関する基礎理解(Data Parallel、Model Parallelなど)
・Python/C++などでの性能チューニング経験

【歓迎スキル】
・LLMの推論最適化や軽量化に関するOSS貢献または論文発表経験
・Megatron-LM、DeepSpeed、vLLMなどのフレームワーク実装経験
・Triton Inference ServerやRayなどの分散推論基盤の知識
・GPUクラスタ環境での実運用経験(Kubernetes、Slurm、etc.)
・研究チームとの共同開発経験、MLPerfなど性能ベンチマークの知見

【求める人物像】
・LLMの推論最適化や軽量化に関するOSS貢献または論文発表経験
・Megatron-LM、DeepSpeed、vLLMなどのフレームワーク実装経験
・Triton Inference ServerやRayなどの分散推論基盤の知識
・GPUクラスタ環境での実運用経験(Kubernetes、Slurm、etc.)
・研究チームとの共同開発経験、MLPerfなど性能ベンチマークの知見

▼その他
・日本国内で就業可能な方
・開発に関する技術的な内容含め、日本語で円滑にコミュニケーションが取れる方
 ‐ 目安:日常会話レベル
雇用形態 正社員
勤務地 東京都 港区南青山1丁目12-3 LIFORK MINAMI AOYAMA S209
給与 755万円 1305.8万円
特殊就業時間 1ヶ月の標準労働時間:1日8時間×営業日数
フレックスタイム制
福利厚生 【保険】
関東ITソフトウェア健康保険組合加入

【諸手当】
・リモートワーク準備一時金(初回給与にて一律5万円)
 - リモートワークを行うための準備に要する費用として支給

【その他】
・定期健康診断
・インフルエンザ予防接種
・希望のPC支給
・オフィスにて水/コーヒー/炭酸/アルコールなどのドリンク無料提供
・オフィスグリコ設置
・屋内禁煙(屋外喫煙所あり)

【教育・スキルアップ】
・入社後5日間のオンボーディングあり
・月1回の研究日制度(自身の技術向上・学習目的)

【社内コミュニケーション】
・週1回全社オンラインミーティング
・月1回懇親会(オフライン開催、一部オンライン有り)
・半期1回キックオフ(オンライン&オフラインのハイブリッド開催)
休日・休暇 ・土日祝(完全週休2日制)
・年末年始休暇
・有給休暇(入社時付与 ※付与日数は入社月による)
・産前産後休暇
・育児休暇
試用期間 3ヶ月
更新日 2025年11月26日

会社概要

会社名 ストックマーク株式会社
設立年月 2016年11月01日
代表者氏名 林達
事業内容 テキストマイニング×AI技術を活用したビジネス意思決定サポートサービスの開発・運営 ストックマーク株式会社(StockMark Inc.)は、東京大学における最先端のテキストマイニング/ディープラーニング研究をベースとして、2015年4月に創業された東大発AIベンチャーです。ヒトと情報の関係性を効率化し、溢れかえる情報に振り回されずヒトがクリエイティブな作業に集中出来る、そんな世界を目指しています。 【事業詳細】 「Anews」2016年スタート以来1,000社導入を達成。国内外3万メディアからリリースされる1日約30万記事をディープラーニングをベースとした独自のアルゴリズムにより各企業様向けにカスタマイズして配信することで、ビジネスにおける情報収集の効率性を飛躍的に向上させます。全てのビジネス活動のベースとなる情報収集・共有業務をAIで効率化することによって、ホワイトカラーの生産性向上を目指しています。 「AIアルケミスト」東京大学大学院工学系研究科・矢谷研究室と共同で、企業におけるAI活用をサポートする「AIアルケミスト」プロジェクトを2018年2月より実施しています。ストックマーク社が有する最先端のAIテクノロジーと東大矢谷研におけるHCIの知見を掛け合わせ、各企業における社内業務効率化・新規サービス創出を支援します。
従業員数 62人