ロシアの金融エコシステム「ズベル」が、ロシア語で書かれたテキストを基にイメージを創造する初のマルチモーダル・ニューラルネットワークruDALL-Eのプレゼンテーションを行った。
イメージの構築は次のように行われる。まず1つのニューロネットワークが文章を加工して、いくつかの画像を作り、次のニューラルネットワークがその中から、文章にもっとも合致したものを選び、3つ目のニューラルネットワークが画質を維持したまま拡大して、最終的な結果を出す。
イメージを作りたければ、サイトに行くか、ロシアのインスタントメッセージアプリ「テレグラム」のニューラルネットワークのチャットボットを利用し、作りたいイメージを文章にして入力し、結果を待つ。普通、結果が出てくるのには数分かかる。同じ文章を複数回入力することもでき、そのたびにニューラルネットワークは違ったイメージを作り出す。
ニューラルネットワークは画像と文章の学習を続けている。「ズベル」社は、ニューラルネットワークにはまだまだ大きなポテンシャルがあると強調しインテリアデザインやストック写真、広告イメージ、広告コピー、また建築や産業デザインにも活用することができるとしている。
ただイメージは極めて奇妙で、ときに恐ろしいものだったりすることが多く、ユーザーたちはソーシャルネットワーク上で、得られたイメージを喜んでシェアしている。
では、ニューラルネットワークで創り出されたイメージをいくつか紹介しよう。