Cate Cadell
[平頂山(中国・河南省) 28日 ロイター] – ここは中国内陸の河南省にある某村。犬が吠え、鶏が歩き回るなかで、住民が未舗装の道路沿いに並び、自分たちの顔の画像と引き替えに、ヤカンやポット、ティーカップを手に入れている。
列の先頭では、三脚に取り付けたカメラの前に1人の女性が立っている。彼女は顔の前に、目と鼻の部分を切り取った自分の顔写真を持ち、ゆっくりと向きを変えている。
住民らは整理番号付きのチケットを持って順番を待っている。何人かは、この種の仕事に来るのは3、4回目だと話していた。
かつての国家指導者である故毛沢東主席のポスターも飾られた、中庭付きの静かな農家の外で進められているのは、AIソフトウェアが現実の顔の特徴と静止画を区別できるように訓練するための素材を収集するプロジェクトだ。
Qianji Dataのリュー・ヤンフェンCEOは、「最大のプロジェクトには数万人が参加している。すべてこの地域に住む人々だ」と語る。同社はこの村に近い、平頂山市の企業で、データを収集・分類し、中国の最大手テクノロジー企業数社に提供している。
リュー氏は「我々はさらに多くのデータセットを作り、さらに多くのAIアルゴリズム企業に提供する。それによって、中国の人工知能開発に貢献できる」と語るが、提供先企業の名称は明らかにしなかった。
AIアルゴリズムの訓練用データへの需要は急増しており、写真や動画などの情報を収集する新たなグローバル産業が育ちつつある。収集された情報は分類され、AIに今見ているものが何であるかを教えている。
こうしたデータ分類、あるいはデータ・アノテーションと呼ばれる事業に関与する企業としては、アマゾン・ドットコムが運営するメカニカル・タークなど簡単な作業と引き替えにユーザーに少額の報酬を提供するクラウドソーシングサイト、インドのウィプロなどのアウトソーシング企業、さらにはQianjiのようにデータ分類を専門とする企業がある。
AI分野に特化した米調査会社コグニリティカの試算によれば、機械学習に関連した世界のデータ・アノテーション市場は2018年に66%成長して5億ドル(約540億円)規模に達し、2023年までにはさらに2倍以上に拡大すると見られる。だが一部の業界関係者は、事業の大部分については情報が開示されておらず、正確な試算は困難だと話している。
<弱いプライバシー保護法制、安い人件費>
データ収集・分類産業の主要な中心地として台頭しているのが中国だ。共産党政権の支援を受けた新興のAIセクターからの飽くことのない需要が支えとなっている。中国政府は、AIを経済成長の原動力、社会統制のツールと考えている。
多くの企業が、いわゆる機械学習と呼ばれるAI分野に巨額の投資を進めている。データのなかにパターンを見出すことを基礎とする、顔認識テクノロジーなどのシステムの柱となる部分だ。
こうした企業のなかには、アリババ・グループ・ホールディング<BABA.N>や騰訊控股(テンセント・ホールディングス)<0700.HK>、百度(バイドゥ)<BIDU.O>といった巨大テクノロジー企業もあれば、AIに特化したセンスタイム・グループや音声認識の科大訊飛(アイフライテック)<002230.SZ>といった比較的新しい企業もある。
結果として中国では、顔認識テクノロジーに基づく決済システムから自動監視システム、さらには国営メディアに登場したAIで動くアニメによるニュースキャスターに至るまで、AI製品・サービスが増殖している。
中国国内の消費者はこうしたテクノロジーを斬新で未来的なものと受け止めることがほとんどだが、プライバシー侵害の程度が高いアプリケーションに関しては懸念の声も一部で上がっている。
中国がAI分野でのグローバル・リーダーをめざすうえで、プライバシー保護法制の弱さと人件費の安さは競争優位となっている。河南省の村の住民たちは、数回の撮影をこなしてティーカップを、あるいは数時間の撮影と引き替えに鍋をもらって満足している。
<顧客は海外にも>
有力なデータ分類企業であるベーシックファインダーは、北京に本社を置いているが、河北省、山東省、山西省にも拠点を有し、国内外でしっかりとした顧客基盤を築いている。
同社の北京本社を訪れたところ、何人かのスタッフが眠そうな人々の画像を分類していた。居眠り運転をしそうなドライバーを特定するための自動運転プロジェクトに使われる予定だという。
他のスタッフは、欧米のオンライン祖先検索サービス向けに英国の19世紀以降の文書の分類作業を行っており、出生証明書・死亡証明書の日付、氏名、性別の欄にマーキングを施していた。
ベーシックファインダーのデュー・リンCEOによれば、熟練した分類スタッフを中国で雇用する方が、西側のクラウドソーシング市場を利用するよりも安上がりだという。
プリンストン大学による自動運転関連プロジェクトでは、当初アマゾンのメカニカル・タークに業務を委託していたが、業務が複雑になるにしたがって受託者がミスをする例も増えてきたため、結果の修正を支援するためにベーシックファインダーに声がかかった、とデュー氏は言う。
このプロジェクトでは、クラウドソーシングで集めたスタッフ3人分の業務を、ベーシックファインダーの熟練分類スタッフ1人で処理できたという。「我々に委託する方が分類業務のコストが安くなることが徐々に分ったので、最初からすべてを我々に発注することになった」
プリンストン大学はコメントを控えている。
データの分類を担う従業員にとって、中国のデータ処理産業に身を投じる理由は簡単だ。退屈に感じられることもあるとはいえ、中国の中小都市・村落に戻りたいと考える若年労働者が就ける他の仕事に比べれば、この仕事は恵まれている。
Qianjiで働く分類スタッフは、人々の写真、監視カメラの映像や街路の画像にデータポイントを付加する作業で、1日約100元(約1600円)の収入を得ている。
従業員によれば、たいていは簡単な作業だが、一部の海外コンテンツに関しては厄介な部分もあるという。
Qianjiの分類スタッフであるジア・ヤフイさんは、「あるとき、欧州スタイルの食洗機の付いた調理機械だと思って分類していたら、後になって、実際には別々のレンジ台と食洗機だと言われた」と語る。
こうした分類作業は、テクノロジー産業による雇用の恩恵の一部を農村地域にもたらしているが、分類スタッフがやっている作業の多くを肩代わりできる程度にAIが進化してしまえば、その恩恵も短命に終る可能性がある。
QianjiのリューCEOは、「この産業はまだ3─5年は存在し続けると思う。だが長期的なキャリアにはならないかもしれない。今のところは5年計画しか考えられない」と語った。
(翻訳:エァクレーレン)
ご利用上の不明点は ヘルプセンター にお問い合わせください。