序文
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
、午後9時25分だった。エラーの修復を続けるためにログオンしたダナのコンピュータのスクリーンの柔らかな光が、彼女の血走った目をまぶしく照らしていた。赤いパイプラインと開いている無数のタブが彼女のスクリーンを埋め尽くしていた。彼女は夕食を食べ、日常の雑用を済ませたが、心はそこになかった。
その日は、長いトレーニングの合間を縫って、サポート・チームと顧客からのローン申請却下の理由についてのクエリについてメッセージをやり取りする、激しい一日だった。彼女は、データとモデルのアーキテクチャに様々な手を加えているにもかかわらず、モデルのパフォーマンスが向上しない理由をデバッグするために、深いところへ入ったり出たりしていた。時折、スタック・トレースを見ては事態を悪化させるばかりだった。
彼女は疲れていたし、彼女のローカルマシンには未コミットのコード変更が山積みになっていた。しかし、彼女はGoを続けなければならなかった。彼女のチームはすでに初期リリース日に4ヶ月遅れており、重役たちの焦りが表れていた。さらに事態を悪化させたのは、自分の仕事が危うくなるかもしれないという不安だった。彼女の会社では10人に1人が解雇され、そのうちの何人かは彼女の知り合いだった。
彼女のチームの誰もが善意で有能だったが、退屈なテスト、不安だらけのデプロイ、読みにくく脆弱なコードをかき分けるといった泥沼に毎日はまり込んでいた。数ヶ月の労苦の後、彼らはみな疲れ果てていた。彼らは最善を尽くしていたが、基礎のない家を建てているような気分だった。
多くの人が機械学習(ML)の旅を勢いよく始め、すぐに自信を持つことができるのは、ツールやテクニック、チュートリアル、ML実践者のコミュニティといったエコシステムが成長しているおかげだ。しかし、チュートリアルノートやKaggleコンペティションといった管理された環境から、現実世界の問題領域、乱雑なデータ、相互接続されたシステム、様々なオブジェクトを持つ人々といったスペースに足を踏み入れると、必然的にMLの可能性を実践で実現するのに苦労することになる。
データサイエンスは最もセクシーな仕事であるという華やかな謳い文句を一皮むけば、MLの実務家は負担の大きい手作業、複雑で脆いコードベース、本番環境では日の目を見ることのないSisypheanなML実験によるフラストレーションに陥っていることが多い。
2019年、データサイエンス・プロジェクトの87%が本番稼動に至らないと報告された。Algorithmiaの2021 Enterprise AI/ML Trendsによると、MLモデルの本番デプロイに成功している企業でも、調査回答者の64%が新しいモデルのデプロイに1カ月以上かかると回答しており、2020年の56%から増加している。Algorithmiaはまた、調査対象組織の38%が、データサイエンティストの時間の50%以上をモデルのデプロイに費やしていることも発見した。
このような障壁は、ML実務者がMLの専門知識を応用して顧客やビジネスにAIの価値と約束を提供することを妨げ、場合によっては妨げることさえある。しかし、良いニュースは、このようになる必要はないということだ。過去数年間、私たちは様々なデータやMLプロジェクトに携わり、様々な業界のML実務者と協力する機会に恵まれた。我々が上記で概説したような障壁や痛みがある一方で、ML実務者がML対応製品を顧客の手に確実に届けるための、より良いパス、プラクティス、作業システムも存在する。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access