本文へ移動
_7S_0117

役割

MLOpsエンジニアのミッションは、チューリングが採用するデータセントリックAIのアプローチにおいて、モデル開発の効率を圧倒的に向上させることにあります。具体的には、データの品質を維持した状態でデータ量をスケールさせるという非常に難易度の高い課題に取り組みます。LiDAR、カメラ、GNSS、IMUなどの非構造化データを扱う大規模なデータパイプラインを、クラウドを活用して自動化・高速化し、MLエンジニアが迅速にモデル開発を進められるような強固な基盤を構築・運用することが、彼らの主要な役割となります。

業務内容

  • 機械学習エンジニアと協力し、データやモデルの継続的な改善
  • クラウド等を活用した処理の自動化や、内部ツール・サービスの実装
  • システムアーキテクチャの設計

ソフトウェアエンジニア(MLOps)として働くメリット

チューリングでMLOpsとして働くメリットは、非構造化データ(LiDAR、カメラ、GNSS、IMUなど)を扱う大規模なデータパイプライン構築という、他では類を見ない経験ができる点です。自動運転という現実世界に影響を及ぼす技術的課題に触れながら、テラバイト級のデータを処理するインフラの設計・開発に携わることができます。

また、非構造化データを扱うデータパイプラインの構築は、これまで確立されたレファレンスが少ない技術領域です。そのため、既存の枠にとらわれず、新しい技術的な課題に対して自ら解決策を生み出し、開発を進めていく面白さがあります。

加えて、この職種のミッションは、データセントリックAIのアプローチにおいて、データの品質維持とデータ量のスケールを両立させ、MLエンジニアのモデル開発効率を圧倒的に向上させることです。クラウドを活用し、データの処理を自動化・高速化する仕組みを作ることで、会社のコア技術であるML開発の基盤を支えるという、非常に重要な役割を担えます。自身の携わったソフトウェアが、「自動運転」という未来の技術に現実世界で影響を与えるという、大きなやりがいを感じられるでしょう。

この職種にマッチする人材

本職種には、大規模なソフトウェア開発の経験があり、特にETL基盤やワークフローエンジン、大規模なデータクラスター(Hadoop、Kafkaなど)の構築・運用に携わった方がマッチします。

チューリングが扱うのは、カメラやLiDARといった非構造化データであり、そのデータパイプラインをスケーラブルかつ高効率に構築・運用するスキルが求められます。また、ゲーム開発(スマホゲーム、PCゲームなど)や大規模な広告配信・動画配信・推薦基盤の開発において、高アクセス、高トラフィック、低レイテンシーといった厳しい要件を持つシステム開発を経験してきた方は、その知見を活かせます。データエンジニアリングのスキルと、プロダクト開発の視点を併せ持つ人材が理想的です。

  • 大規模なソフトウェア開発の経験が豊富な人。
  • ETL(抽出・変換・ロード)基盤やワークフローエンジンの開発・運用経験がある人。
  • HadoopやKafkaなどのデータクラスター構築・運用に携わった経験を持つ人。
  • 高アクセス、高トラフィック、低レイテンシーが要求される大規模サービス開発経験がある人。
  • 大規模な広告配信、動画配信、推薦基盤の開発経験を持つ人。
  • クラウド活用によるインフラやデータ処理の自動化・高速化に意欲のある人。
  • 非構造化データ(LiDAR, カメラ等)を扱うデータパイプライン構築に興味がある人。
  • データ品質の維持とデータ量スケールという難易度の高い課題に挑戦したい人。
  • レファレンスのない技術領域において、自ら解決策を生み出すことにやりがいを感じる人
  • MLエンジニアのモデル開発効率を圧倒的に向上させることをミッションにできる人。

他職種連携の魅力とやりがい

インフラエンジニア(GPUクラスタ)

MLOpsが構築する大規模なデータパイプラインやソフトウェアが動作する実行環境(クラウド、オンプレミスインフラ)の要件定義や調整を行います。特に大規模なバッチ処理を行う計算基盤の要件定義や、AWSなどのクラウドにあるデータパイプラインから、オンプレミスや別のクラウドにある学習環境へのデータ転送にかかる時間の削減や、データの適切な転送の仕組みづくりに取り組みます。これは自動運転開発のイテレーション速度に直結する重要な課題です。

大規模なバッチ処理を行う計算基盤という、一般的な環境ではなかなか出会えない特殊な要件を持つインフラ開発に携われます。ドメインスペシフィックな要件が生み出す技術的な課題を、インフラ側と協調して解決する面白さがあります。特に、複数クラウド環境を跨いだデータ転送の最適化は、自動運転開発の速度を根底から支えることに繋がり、非常に大きなやりがいを感じられます。

ソフトウェアエンジニア(自動運転システム)

現実世界のデバイス(センサー)からデータが書き出される仕組みや、書き出されるデータの形式・内容について連携します。データパイプラインの起点となるデータの収集部分でエラーが発生したり、望む形式でデータが書き出されない場合に、共同で原因を特定し、データの書き出し形式や仕組みの変更に取り組みます。

現実世界のデータをいかに効率良く、モデル学習に利用できる形で取得・加工できるかという、極めて本質的な課題に向き合えます。デバイスから出力されるデータの品質と形式が、後のモデル学習の成否を分けるため、データパイプラインの「川上」の改善に関われることは、技術的な面白さと重要性を感じられます。

MLエンジニア

データセットの作成と改善、キュレーションの仕組み構築、データ処理・変換の高速化など、MLモデル開発に必要なデータの流れ全体に関する業務を共同で行います。MLエンジニアが求めるデータセット作成における要件を満たすためのパイプライン改善が中心となります。

大規模な非構造化データの高速処理という、技術的な難易度が非常に高い領域に挑戦できます。この課題を解決することで、MLエンジニアの「試したい」という施策を迅速に実行可能にし、開発全体の生産性を飛躍的に高めるという、組織貢献における大きなやりがいを得られます。