デジタルヒューマンは、あなたの次のお気に入りの有名人、またはファイナンシャルアドバイザーになる可能性があります

デジタルヒューマンは、あなたの次のお気に入りの有名人、またはファイナンシャルアドバイザーになる可能性があります

wccftech

Baidu AI Cloudによって作成され、中国の有名人であるSimonGongをモデルにしたデジタルヒューマン。

「需要の高まりがデジタルヒューマンのブームを後押ししています」と、デジタルモデル俳優のゴングを作成したBaiduのデジタルヒューマンおよびロボット工学ビジネスの責任者であるShiyanLi氏は述べています。 「中国だけでも、4億人を超えるACGN(アニメーション、コミック、ゲーム、小説)ファンがおり、デジタルヒューマンを中心とした数千億ドル相当の企業市場があります。」 また、企業登録を追跡している会社、Qichachaによると、中国には現在、デジタル人間関連の活動に従事する28万を超える企業があります。

別の種類のデジタル

「バーチャルアイドル」の概念が何年も前から存在しているため、Baiduのデジタル有名人のデビューは最初はそれほど多くないように思われるかもしれません。 たとえば、米国のバーチャルインフルエンサー リル・ミケーラ 2016年以来、オンライン広告やテレビコマーシャルに本物の有名人と並んで登場し、300万人以上のInstagramフォロワーを獲得しています。 ただし、仮想の中国のスターには別の何かがあります。これまでにないレベルで実際の人間に耳を傾け、話し、対話する能力を備えたデジタル人間です。 そして、ゴングのデジタル業務は歌うことに限定されていません。 中国を代表する検索プラスフィードアプリであるBaiduAppの最新アップデートでは、Gongがユーザーの携帯電話に表示され、モデル俳優の実際の声を使用した検索とクエリを支援します。 このインタラクティブな検索エクスペリエンスは2021年に開始されて以来、Baiduアプリでの音声検索クエリの数を18.2%増やしました。

Baidu AI Cloudは、上海浦東発展銀行(SPD)と共同で、2019年に最初にデジタル従業員の開発を開始しました。 その後、彼らは実際の従業員が不在のときに人間の銀行の代表者と同等のサービスを提供するためのデジタルファイナンシャルアドバイザーの構築に注力しました。 今日、SPD Bankによると、毎月46万人以上の顧客が銀行サービスとポートフォリオ管理をデジタルヒューマンに依存しています。 「通常の営業時間外にデジタルヒューマンにアクセスできるため、SPD銀行は24時間年中無休のカスタマーサービスを低コストで高効率で提供できます」と銀行の担当者は言います。

最近では、Baiduが作成した仮想アンカーが、2022年の北京冬季オリンピックで聴覚障害のある視聴者に手話でライブ解説を提供しました。 アバターは、実在の人物のように見えるだけでなく、音声認識と手話通訳機能を備えており、迅速で高精度の入力と出力を保証します。 によると、世界中で約4億3000万人が難聴を「無効にする」ことを経験しています。 世界保健機構、このテクノロジーを使用して、幅広いコンテンツにアクセスする能力を高める可能性があります。

BaiduAICloudのXiLingによって作成された手話通訳者。

XiLing:AIプラットフォームの新世代

エンターテインメントから公共サービスまで、デジタルヒューマンは私たちの日常生活においてより大きな役割を果たすように設定されています。 しかし、その自然で楽な外観の背後には、AIイノベーションの限界を押し上げる新しいテクノロジーの複雑なウェブがあります。

Baidu AI Cloudのデジタル有名人と仮想手話アンカーは、2021年に発売された新しいデジタルプラットフォームであるXiLingによって作成されました。6月21日に開催されたBaidu World 2022イベントで、同社はデジタルの作成をサポートするXiLingの新機能を発表しました。ライブストリームのホストになり、一休みすることなく、リアルタイムで歌ったり、踊ったり、コメントに返信したりできる人間。 XiLingは、リアルなペルソナの作成から会話やコンテンツ生成のスキルを身に付けるまで、デジタルヒューマンを作成するプロセス全体をサポートする独自の機能を備えています。 その最も印象的な属性の1つは、速度です。 プラットフォームは、1〜2週間で実在の人物に基づいた3Dアバターを生成できますが、2Dアバターはほんの数分で作成できます。

さらに、XiLingのインテリジェントな対話ツールを使用して、作成者はデジタルヒューマンの会話能力をすばやくカスタマイズし、時間をかけて適応させ、学習させることができます。 この機能は、Baiduの プラトン、デジタル人間がオープンドメインの会話に参加できるようにする、つまり、あらゆるトピックを理解し、関連する応答を提供できるようにする、1,000億パラメータの対話モデル。 98.5%を超える精度の高精度の音声認識とリップシンクにより、デジタルヒューマンはよりスムーズで人間らしいインタラクションを実現できます。 「高度なAIテクノロジーを使用することで、デジタルヒューマンの構築コストを削減し続け、実際の人間とのやり取りを大幅に改善できます」とLi氏は言います。

すべての本物の人間が独自のスキルと才能を持っているように、新世代のデジタル人間もそうです。 これには、Baiduのような大規模なAIモデルによる最近の進歩のおかげで、デジタル人間に創造性を発揮する能力を与えることも含まれます。 ERNIE、プロンプトが表示されたら、テキストを生成してリアルな画像を作成できます。 たとえば、ブランドのスポークスパーソンとして機能するように設計されたデジタルヒューマンは、ソーシャルメディアで独自に作成して投稿したり、ポスターをデザインしたり、ビデオで演奏したりできます。

Sharing is caring!

Leave a Reply