次世代の AI に備える

The Algorithm を毎週月曜日に受信トレイに受け取るには、ここでサインアップ.

アルゴリズムへようこそ！

他にめまいを感じている人はいますか？ AI コミュニティがテキストから画像へのシステムの驚異的な進歩に頭を悩ませていたちょうどその時、私たちはすでに次のフロンティアであるテキストからビデオへと進んでいます。

Meta は先週末、テキストプロンプトから 5 秒間の動画を生成する AI である Make-A-Video を発表しました。

オープンソース上に構築データセット、Make-A-Video を使用すると、「空を飛ぶ赤いマントが付いたスーパーヒーローの衣装を着た犬」などの一連の単語を入力して、非常に正確でありながら奇抜な美学を備えたクリップを生成できます。古いホームビデオ。

この開発は生成的 AI のブレークスルーであり、いくつかの難しい倫理的問題も引き起こします。テキストプロンプトからビデオを作成するのは、画像を生成するよりもはるかに困難で費用がかかりますが、Meta がこれを非常に迅速に行う方法を思いついたことは印象的です。しかし、テクノロジーが発展するにつれて、誤った情報を作成して広めるための強力なツールとして利用される可能性があるという懸念があります. それについての私の話をここで読むことができます。

発表されてからわずか数日ですが、メタのシステムはすでに基本的なものに見え始めています.これは、主要な AI 会議の 1 つである学習表現に関する国際会議に論文で提出された多数のテキストからビデオへのモデルの 1 つです。

別の、と呼ばれるフェナキ、さらに高度です。

テキストプロンプトだけではなく、静止画像とプロンプトからビデオを生成できます。また、はるかに長いクリップを作成することもできます。ユーザーは、ビデオのスクリプトを形成するいくつかの異なるプロンプトに基づいて、数分の長さのビデオを作成できます。 (例: 「写真のようにリアルなテディベアがサンフランシスコの海で泳いでいます。テディベアは水中に入ります。テディベアは水中でカラフルな魚と一緒に泳ぎ続けます。パンダベアは水中で泳いでいます。」)

このような技術は、映画製作とアニメーションに革命をもたらす可能性があります。これがどれほど迅速に起こったかは、率直に言って驚くべきことです。 DALL-Eは昨年発売されたばかりです。来年のこの時期に私たちがどこにいるのかを考えるのは、非常にエキサイティングであると同時に少し恐ろしいことでもあります.

Google の研究者も、新しいモデルに関する論文を会議に提出しました。ドリームフュージョン、テキストプロンプトに基づいて 3D イメージを生成します。 3D モデルはあらゆる角度から見ることができ、照明を変更することができ、モデルをあらゆる 3D 環境に配置することができます。

これらのモデルですぐに遊べるようになるとは思わないでください。Meta は Make-A-Video をまだ公開していません。それはいい。 Meta のモデルは、Stable Diffusion の背後にあるものと同じオープンソースの画像データセットを使用してトレーニングされています。同社は、有毒な言葉や NSFW の画像を除外したと述べていますが、データセットが何百万ものサンプルで構成されている場合、人間の不快感のすべてのニュアンスを捉えているという保証はありません。また、簡単に言えば、同社が構築するシステムによって引き起こされる被害を抑えることに関しては、輝かしい実績があるわけではありません。

Pheraki の作成者は次のように書いています。紙彼らのモデルが生成するビデオの品質はまだ本物と見分けがつかないほどではありませんが、「今日でも可能性の範囲内です」. モデルの作成者は、モデルをリリースする前に、データ、プロンプト、およびフィルタリング出力をよりよく理解し、害を軽減するためにバイアスを測定したいと述べています。

オンラインで何が本当なのかを知ることはますます難しくなる一方です、ビデオ AI は、ターボチャージされたディープフェイクの可能性など、オーディオや画像には存在しない多くの固有の危険をもたらします。 TikTok や Instagram などのプラットフォームは、拡張された顔フィルターを通じて、私たちの現実感をすでに歪めています。 AI が生成した動画は、誤った情報を伝えるための強力なツールになる可能性があります。人々は、同じコンテンツの偽の音声やテキストバージョンよりも、偽の動画を信じて共有する傾向が強いためです。によるとペンシルベニア州立大学の研究者に。

結論として、私たちは理解に近づいていません 言語モデルの有毒な要素をどうするか。テキストから画像への AI システムに関する害の調査は、まだ始まったばかりです。ビデオ？頑張ってください。

より深い学習

EU は企業を有害な AI の罠にかけたいと考えている

EU は、AI 企業に損害を与えたとして訴訟を起こしやすくするための新しい規則を作成しています。先週公開された新しい法案は、数年以内に法律になる可能性が高く、AI 開発者に危険なシステムをリリースしないように強制するヨーロッパからの圧力の一部です。

AI責任指令と呼ばれる法案は、ほぼ同時期に法制化される予定の EU の AI 法に力を加えます。 AI 法では、人に危害を加える可能性が最も高い AI の「ハイリスク」な使用について、追加のチェックが必要になります。これには、警察、募集、または医療に使用される AI システムが含まれる可能性があります。

賠償責任法は、損害が発生した時点で適用されます。これにより、個人や企業は、AI システムによって損害を受けた場合に損害賠償を求める権利を得ることができます。たとえば、雇用プロセスの一環として、差別的な AI が使用されて不利な立場に置かれたことを証明できた場合などです。

しかし、落とし穴があります: 消費者は、同社の AI が消費者に損害を与えたことを証明する必要があり、これは大仕事になる可能性があります。それについての私の話をここで読むことができます。

ビットとバイト

ロボットと AI がより優れたバッテリーの開発にどのように役立っているか
カーネギーメロン大学の研究者は、自動化されたシステムと機械学習ソフトウェアを使用して、リチウムイオン電池をより高速に充電できる電解質を生成し、電気自動車の普及に対する大きな障害の 1 つに対処しました。 (MITテクノロジーレビュー)

スマートフォンは自殺の予測に役立つか?
ハーバード大学の研究者は、スマートフォンや Fitbit ウォッチなどのウェアラブルバイオセンサーから収集したデータを使用して、患者が自殺の危険にさらされている時期を予測し、臨床医が介入するのに役立つアルゴリズムを作成しています。 (ニューヨークタイムズ)

OpenAI は、テキストから画像への AI DALL-E をすべての人が利用できるようにしました。
AI によって生成された画像はあらゆる場所に存在します。ソフトウェアを試すことができますここ.

誰かが有名人のそっくりさんをポケモンにするAIを作った。
重要な唯一の画像生成 AI。 (ワシントン・ポスト)

読んでくれてありがとう！また来週。

メリッサ

より深い学習

ビットとバイト

Related Posts

iPhoneが充電されないのはなぜですか？ どうすれば修正できますか

2022年なので、もちろん任天堂Wiiをプレイしています

Ricochet Anti-Cheatは、WarzonePacificでいくつかの詐欺師を阻止しました

Leave a Reply Cancel reply

iPhoneが充電されないのはなぜですか？どうすれば修正できますか