国内最大規模の分散型AI推論基盤の構築・運用に従事していただきます。
要件に合わせてGPUサーバー、ネットワーク、セキュリティを設計・構築し、安定運用とスケールを実現する推論基盤の立ち上げを担います。
【仕事内容】
下記の業務を担っていただく想定です。
・GPUサーバー、NIC、スイッチ等のハードウェア選定、設置、構築、運用管理
・GPUリソースの割り当て管理(可視化・最適化・運用ルール整備)
・GPUサーバーの障害対応、保守、修理調整(切り分け、RMA、ベンダー連携)
・検証機材の評価、検証(性能・安定性・互換性・Burn-in)
・データセンターネットワーク構成の設計、構築(L2/L3、冗長、帯域)
・FW/IPS/UTM等の設計、運用、監視
・回線(トランジット等)の調達に関する調整、設計(要件定義、SLA、冗長)
・データセンター事業者、回線事業者、機材ベンダー等との技術調整
・推論GPUに対応したマーケットプレイスへの接続および運用管理
・技術仕様の策定、運用フロー整備(監視項目・手順書・エスカレーション)
・必要に応じた監視/ログ基盤設計、構成管理、資産管理、性能検証
※詳細は面談時にお伝えします。
・サーバーまたはネットワークの設計、構築、運用経験
・障害対応(切り分けから復旧、再発防止まで)の実務経験
・ベンダー、キャリア、データセンター等との技術調整経験
・データセンター環境での構築経験(ラック、配線、電源、熱など)
・GPUサーバーの運用経験、またはHPC/クラスターに関する経験
・回線冗長、トランジット調達、BGP等の知見
・社内外(データセンター/回線/ベンダー/顧客)を巻き込み、プロジェクトを前に進められる方
・仕様策定と現場運用を行き来し、再現性のある仕組みに落とし込める方
1回
オンライン
Win/Mac どちらか
非公開非公開非公開非公開非公開
非公開
非公開
非公開
非公開
非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開非公開
非公開
非公開
非公開
非公開
非公開非公開非公開非公開非公開非公開非公開
非公開非公開非公開
非公開
非公開非公開非公開
非公開
非公開非公開非公開非公開非公開非公開非公開非公開
非公開非公開非公開非公開
多くの案件を取り扱っている企業でございます。
こちらのPJが終了しても別のPJにアサインできる可能性がございます。
人気案件の場合、早期に募集が終了する可能性がございます。お早めのご登録とエントリーをお勧めいたします。
何かお悩みやご相談がある場合は、「個別相談会」や「お問い合わせ」からお気軽にご連絡ください。