会社概要
ストックマーク株式会社は「価値創造の仕組みを再発明し、人類を前進させる」をミッションに掲げ、最先端の生成AI LLM技術を活用し、企業の変革を支援しています。
弊社の強みは、フルスクラッチで国産LLMを開発できる技術力です。2024年5月には、国内最大級となる1,000億パラメータの日本語特化LLM「Stockmark-2」を公開しました。
多くの企業が海外モデルの微調整やOSS活用にとどまる中、当社はゼロから自らの手でモデルを設計・構築。日本語とビジネス領域に最適化された性能は、国産最高クラスの水準を誇ります。さらに、ハルシネーションを大幅に抑えており、自社管理下で安全に運用可能です。
単なる“生成AIの利用企業”ではなく、“AIそのものを創る企業”として、日本の産業競争力を技術で支えていく存在となることを目指しています。
この技術力を活かして事業展開しており、現在はSaaS事業として製造業向けAIエージェント「Aconnect」、PaaS新規事業として業務AI実装支援プラットフォーム「SAT(Stockmark A Technology)」を運営しています。
創業時からエンタープライズ企業をターゲットとしており、すでに日経225の30%、300社を超える企業様での導入が進んでいます。今後は製造業のR&Dを起点に、国内のエンタープライズ企業はもちろん、日本企業全体そしてグローバル企業にも展開していく予定です。
現状の課題
- 数億件規模のWeb上の文献をクローリング/コンテンツ抽出/配信するためのデータパイプラインを開発、運用する人材が不足している
- 自社プロダクトのAI Agent開発のためのデータ拡充の方針検討、要件定義、実装をプロダクトチームのPMやエンジニアとコミュニケーションしつつ自ら実行する人材が不足している
業務内容
当社は、ニュース・特許・論文・Web情報など、企業活動に関わる膨大な公開情報を収集・構造化し、最先端の生成AI技術を活用して、企業の意思決定や事業変革を支援する複数のプロダクトを提供しています。
本ポジションでは、これら全プロダクト共通の基盤となるデータ配信システムに位置づけられる、Webクローラーおよび文書配信パイプラインの設計・開発・運用を担っていただきます。プロダクト価値の根幹を支えるデータ基盤として、安定性・スケーラビリティ・拡張性を意識した開発が求められるポジションです。
エンジニアとして記載の課題解決のための開発を進めながら、データプラットフォームチームをリードし生産性の最大化を行うことも期待しています。
具体的な業務内容
- TypeScript/Pythonを用いたWebニュース・特許・論文などを配信するデータプラットフォームの開発と運用
- サーバーレス環境による分散処理のスケーラビリティ向上と監視設計
※変更の範囲:開発関連業務
チーム構成
- 事業責任者(CEO)1名
- 開発責任者 1名
- プロダクトエンジニア 7名
- AI Agentエンジニア 6名
- 構造化エンジニア 3名
- データエンジニア 3名
- プロダクトマネージャー 1名
- リサーチャー 1名
- CS 2名
- Biz 8名
開発環境
-
[開発言語]
- データパイプライン: Python
- Webクローラー: TypeScript(Node.js)
-
[コンテナ]
- Docker
-
[IaC]
- Terraform
-
[クラウド]
- AWS
-
[ライブラリ]
- Pyspark, Puppeteer
-
[AIツール]
- Cursor, CodeRabbit, Devin
ポジションの魅力
全プロダクト共通の文書配信システムの開発・運用に携わることで、以下のような経験を積むことができます。
- 数億件規模の文書データを対象とした、サーバーレス環境における大規模分散処理の設計・開発・運用経験
- 数万サイトを対象としたWebクローラーの開発を通じて、Webフロントエンド・バックエンド双方の知見を活かしながら、不安定な外部環境を前提とした監視・運用設計のノウハウを習得
- PdMやCustomer Successチームと連携し、プロダクト要件や顧客課題を踏まえた新規開発・改善提案を主体的に行うことで、技術視点から事業にコミットする経験
関連資料
- Opendata チームまとめサイト
- 世界中の情報を収集し、機械学習の力で届ける Opendata Unitのご紹介