Deep Learning ベースのAI 開発は、数百行程度のコーディングと膨大な学習データの単純なラベリング作業に明確に分けられる。割合として大きいラベリング作業には、高度な数学能力は不要で単純作業を繰り返し続ける労働力が必要である。
- xqk0829277379
- 1389
- 4
- 0
- 0
Deep Learning ベースのAI 開発は、数百行程度のコーディングと膨大な学習データの単純なラベリング作業に明確に分けられる。割合として大きいラベリング作業には、高度な数学能力は不要で単純作業を繰り返し続ける労働力が必要である。
2019-06-18 10:51:56IT企業のAI開発は、実は発展途上国の労働者が低賃金で請け負っている。生活のために単調で膨大な作業をこなし、ときにポルノや暴力画像の閲覧も強いられる。 courrier.jp/news/archives/…
2020-03-22 08:37:03世界的IT企業のAI開発を、実はインドなどの発展途上国の労働者が低賃金で請け負っていることはあまり知られていない。生活のために単調で膨大な作業を粛々とこなし、ときにポルノや暴力画像の閲覧も強いられる人々の労働環境に米紙が迫った。 buff.ly/2Un71OY
2020-03-30 21:30:16特に海外からは「日本人は自身で判断が出来ないから採用しても幹部にはしない」と思われている可能性も考慮すべき。昇進もしないし、下働きのまま。1/2 x.com/partyhike/stat…
2023-02-01 07:50:44ただ、もっと怖いのがマスクを外せなくなった子供。彼等が大人になる頃は下働き系の殆どの仕事はAIに取って替わられる可能性が高い。せいぜいAIを教育するネタをマニュアル通りに作って提供するだけの役割しか与えられない可能性が高いかも。 2/2
2023-02-01 07:50:44@iga_harimaru ご存知とは思いますが、AI教育用のネタは途上国に低賃金で作らせています。なので、まさに恐ろしい未来が待っているかも知れません😱
2023-02-01 10:54:08もしAIによってエンジニアが駆逐されても、卓越した手腕で行う手作りにこだわる頑固ジジイエンジニアという知る人ぞ知る伝説の職人カテゴリは生まれてくるのかな、笑 ないか笑
2024-02-04 22:09:13@aa36841289911 なんか最近雲行きが怪しくなってきて、アメリカでも日本でも新聞社のソースを学習に利用するのに制限がかかり始めてます。このままアメリカで多方面に影響が出るようになると、いずれ全世界に波及し、AIの学習に制限がかかるようになり、今後AIはすんなりとは成長できない情勢になるかもしれません🤔
2024-02-04 23:00:49@webnakama そこらへんゴタゴタしてますよね、軽くしか読んでませんけど🤔 「いずれはそうなる」のいずれがそれなりに長い時間になるかもしれませんね。
2024-02-04 23:04:26@aa36841289911 あと、あるテック系podastによると、AIの学習って全部AIだけで完結する訳ではなく、100万単位の人間がモデル評価するからできるのであって、それもアフリカとか発展途上国ですこぶる低賃金でやっている訳で、そのあたりが今後コンプライアンス的に問題になってくるんではないかとか…ううむ🤔
2024-02-04 23:15:19マトリョミン所有の脱力系社会学徒(知識社会学・文化社会学) セミ・パブリック脳分人アカウント facebook.com/artification20…
AIのコストとは? データの選択と取り込みは人間の仕事。 低賃金でデータセット作り労働を担う途上国労働者。誤情報や偏りのある情報など質の低いデータの収集とそれを基にしたAIコンテンツの広がり。 nhk.jp/p/wdoc/ts/88Z7…
2024-04-29 15:46:36#生成AIの正体 ドイル・ベルリンにあるワイゼンバウム研究所。世界初のChat bot自動応答システム製作者ジョセフ・ワイゼンバウム「AIの危険性は機械の思考が人間じみてくることよりも人間の思考が機械じみてくることにある」
2024-04-29 19:50:52データの分類は手作業。Chat GPTのようなAIを機能させるためには人間が必要。コンテンツ・モデレーター。ネット上の違法、自殺、児童ポルノ等「不快なコンテンツ」をチェック管理。作業は外務委託。分類したデータをAIに学習させる。分類の精度次第でAIの判断能力が向上。#生成AIの正体
2024-04-29 20:06:43#生成AIの正体 データセットの量と質は決定的に重要。しかしその出所に注意を払うものは少ない。悪くて当たり前。基準はとても低い。キーワードと関連付けられたデータのチェック。その作業も最近人の手からコモンクロール(ネット上のデータを蓄積し無料で提供する非営利団体)の自動化システムへ。
2024-04-29 22:56:55#生成AIの正体 データセットには深く根付いたステレオタイプが表れていることがある。例えば「美しい」という言葉の多くは裸の女性の画像データが紐づけされている。「ハンサム」だとスーツ姿の男性。スクールガールとスクールボーイの検索結果も異なる。前者は性的画像多、後者は全くそうではない。
2024-04-29 23:02:24#生成AIの正体 「言語モデル」構築研究中の研究者。自分のデジタルクローンも可能に。試しに「なりすまし」、本物偽物区別できるか。学習中のAIその内部の論理(因果関係・処理過程)は分からないブラックボックス。Chat GPTは1兆の単語使用。やがてすべてを使いつくす。
2024-04-29 23:13:14#生成AIの正体 AIが機械学習して生成する大量のデータは、それ自体がAIが学習するデータセットの一部になっていく。このままだと数年後には我々の世界はそうしたコンテンツに完全に汚染される。理論上機械が生成するコンテンツの量が人間が生み出すコンテンツの量を越える。ニセ情報の量産が常態化。
2024-04-29 23:19:31#生成AIの正体 企業は情報の真偽を自動的に見極める手段の開発を求めている。全く逆の仕事をする二つのシステムを作れと。一方で情報を作り出し、もう一方で情報を修正させようとしている。これは大きな間違いの元、と危惧する研究者。
2024-04-29 23:24:03