データベースエンジニア(DevOps/DBA/データエンジニア)※東京/正社員

企業名

ヤフー株式会社

職種

データエンジニア、システムエンジニア

雇用形態

正社員

給与・報酬

勤務地

東京都千代田区紀尾井町

最寄駅

東京メトロ各線 赤坂見附駅から徒歩2分 東京メトロ各線 永田町駅から徒歩3分 東京メトロ有楽町線 麹町駅から徒歩9分

業務内容

【業務概要】
Yahoo! JAPANのデータベースには、膨大な量のデータを格納しており、サービスの成長とともに日々急速なペースで増大しています。
現在RDBは2,000 DB以上、NoSQLは10,000 node以上が必要となっており、多くのYahoo! JAPANのサービスで利用されています。
データウェアハウス基盤は日次で100万を越えるクエリが実行されています。
そして、利用サービスのクエリ、データ特性等、そのデータベースのユースケースはさまざまです。
これらのデータを事業に活用するための、下支えの基礎となる部門として、2つの領域で募集します。

【担当いただく領域】
※担当領域および業務内容は、選考の過程で決定します。

▼DevOps領域
最大のミッションは、大規模なデータベース環境を安定的かつ効率的に運用することです。
また、各々のユースケースに対して、適切なチューニングや、SQL、テーブル設計のアドバイスも行います。
業務を通じて、DBaaS(Database as a Service)を自社で提供するための技術、スケールに対応するためのオペレーション自動化技術など、大規模なデータベースの運用に必要な技術を身につけながら、エンジニアとしての成長を感じることができます。

<主な業務内容>
・MySQL、Cassandra、Oracle、PostgreSQL、HBase DBの構築、運用、パフォーマンス最適化
・データベースのバックアップ、リストアなどの運用自動化ツールの開発
・データベースの新バージョンや新機能の検証、導入
・大規模MySQLプラットフォームの検証、導入
・PostgreSQLプラットフォームの検証、導入

※直近Oracle領域の方を特に募集しています

▼DBA(データウェアハウス)領域
ミッションは、全社で横断利用可能な共通データセットを整備し、データウェアハウスとして提供することです。
多くの利用者を抱えるデータウェアハウス基盤を安定的かつ効率的に運用し、利用者が自由に分析できる計算能力を提供するため、種々の保守・運用作業、負荷対策(ワークロード管理、クエリチューニング)、利用者のサポート、新機能の検証、導入などを行います。
利用者と向き合い、コミュニケーションしながら業務に取り組むことで、大規模かつ処理量の多いデータウェアハウス基盤における運用やデータ管理のスキルを身に付け、データベースエンジニアとして成長することができます。

<主な業務内容>
・大規模データウェアハウス(Teradata)の保守・運用
・新機能検証、クエリーチューニングを含む負荷対策、障害対応
・ベンダコントロール、利用者サポート

▼データエンジニア領域
全社で横断利用可能な共通データセットの整備を行うことにより、利用者(サービス、機械学習など)のデータ活用による事業貢献を推進することがミッションです。
主にTalend等のETLツールを利用し、MySQL、Hive、Teradata、BigQueryなどさまざまなDBに格納されているデータを用いて、利用者のニーズに合わせたテーブルの設計やETLジョブの開発、保守・運用作業、利用サポートなどを行います。
各利用DBの特性と仕様を理解し、大規模なデータ処理を行うスキルを身に付けることで、データエンジニアとして成長することができます。

<主な業務内容>
・大規模データのテーブル設計、ETL開発、ETLジョブの保守・運用
・データの保守、運用
・データ利用者との要件定義、利用サポート

【ポジションの魅力】
※DevOps領域について

1. 大規模環境の運用管理
我々は、本番と開発環境含めて、約600のOracle データベースを運用管理しており、中には数十テラバイトのデータ量を持つデータベースも存在します。このような環境下で、環境構築、データ移行、性能チューニング、製品不具合調査等の経験をする事が出来ます。また、運用工数を削減する為にOperationの自動化等にも取組んでおり、それを実現する為の技術を身につけることが出来ます。

2. 高可用性を実現する技術
Yahoo! JAPANはサービスの質の向上を大切に考えており、OLTPを担うデータベースには高い稼働率が求められます。その為、我々は高可用性を実現する技術を多々採用しています。データベースシステムでシングルフェイラーポイントを作らない為に、必要となる技術を経験し、身につけることが出来ます。

3.ヤフーの全サービスに貢献
メディア、コマース、金融と100を超えるサービスの肝とも言われる、膨大なデータを管理しています。データベースのトラブルはそのままサービスの停止に直結する場合もあり、責任も大きいですが、サービスの性能向上や安定性に貢献しており、縁の下の力持ちとしてヤフーの根幹を担当するやりがいのある仕事です。

応募条件

【必要な経験/スキル】
▼DevOps領域
・Java、Python、Goのいずれかを利用したソフトウエアの開発、運用経験
・データベースの運用経験、またはデータベーススペシャリストの資格
・データベースの状況監視や最適なパフォーマンスチューニングの経験

▼DBA(データウェアハウス)領域
・Teradata、Oracle、Redshift等のDBA役割経験
・TeradataやExadata等アプライアンスの運用経験、またはRedshiftで複数インスタンスを統合に運用した経験

▼データエンジニア領域
・SQLを用いたデータ操作を行う業務の経験
・Java、Pythonのいずれかを利用したデータの加工経験
・テーブル設計、データの保守・運用経験(バッチ処理を含む)

【あると望ましい経験/スキル】
▼DevOps領域
・大規模サービスの開発、運用経験
・プロジェクトマネージメント経験
・OSSの公開、コントリビュートの経験
・OpenStackの運用経験
・データベースオペレーション自動化の開発経験
・ミッションクリティカルなシステム運用経験(パフォーマンスチューニング経験を含む)
・ORACLE MASTER資格保有(12c)
・クラウド/コンテナサービス利用経験(仮想化環境からのDB接続経験)
・インフラ運用経験(NW/ストレージ)

▼DBA(データウェアハウス)領域
・TBクラス、または数十億件のテーブルを扱うクエリーチューニング経験(データウェアハウス全体としては数10TB〜数PBのデータ量を想定)
・Redshift等のクラウドネイティブなデータベース経験
・Hadoopのクエリーエンジン経験(Hive、Presto、Spark等)
・Talend等ETLツールやAmazon EMRを利用したデータ処理経験
・Tableau等BIツールの利用に適したテーブル実装経験
・プログラミング経験(SQL、python、Java、シェル等)

▼データエンジニア領域
・データの組み合わせによる新規データの開発や、データ加工による利用効率化の経験
・大規模データのテーブル設計、運用経験
・Hadoopのクエリーエンジン経験(Hive、Presto、Spark等)
・Talend等のETLツールやAmazon EMRを利用したデータ処理経験
・プラットフォームをまたいだデータ移動業務の経験

こだわりポイント

女性が活躍、学歴不問、即日スタート、経験者優遇、駅から徒歩5分以内、時短勤務可能、10時以降出社OK、フレックスタイム制、社員食堂あり、社会保険完備、育児支援制度、その他特別制度あり

受動喫煙防止情報

屋内受動喫煙対策:なし

案件番号

402225172

応募する

検討中リスト

Symbiorise(シンビオライズ)