
近年、人工知能(AI)の分野が急速に発展し、幅広い用途や産業で利用されるようになりました。
ヘルスケアから金融まで、AI はサービスを改善し、より効率的かつ効果的にするために使用されています。
このブログ投稿では、AI を使用して利用できるサービスのいくつかを探り、それらがさまざまな業界をどのように変革しているかについて説明します。
座ってコーヒーを飲みながら、AI サービスの世界に飛び込みましょう。
↑上の文章は「AIで使えるサービスを紹介するブログ記事前文を考えて」に対するAIの回答です
イラストAI
midjouney

Midjourneyはテキストの説明から画像を作成する独立した研究所で、現在オープンβ版です。
ユーザーはDiscordにアクセスし、ボットにコマンドを送ることでMidjourneyを利用できます。
DALL-E

OpenAI社の開発したディープラーニングモデルで、一般にソースコードは解放されていません。
DALL-E 2β版では事前に登録したユーザーのみの利用が可能でしたが、現在は誰でも利用可能。
Stable Diffusion

オープンソースで公開されているモデルで、多くの人が派生したモデルを開発しています。
テキストから画像を作成するだけでなく、元ある画像を改変する「img2img」なども存在。
https://stablediffusionweb.com/
その他
Waifu Diffusion…違法アップロードサイトDaubouruを学習もとにしたモデル
novelAI…月10ドルのサブスク型モデル
3DモデルAI

Luma Alが提供予定の、テキストから3Dモデルを生成するサイト。
現在はアーリーアクセス中。
https://captures.lumalabs.ai/imagine
音楽AI
CREEVO

京都大学白眉プロジェクト、日本学術振興会 科学研究費の支援を受けている自動作曲AI。
作った楽曲はパブリックドメインとして保存され、ログインすると保存も可能になります。
Orpheus

東京大学(開発当時)の嵯峨山茂樹氏らにより開発され、メロディーの動きを確率モデルで表現。
日本語のアクセントの高低差を基に楽曲を作成し、かなり細かい部分まで指定することが可能。
https://www.orpheus-music.org/Orpheus-menus.php
FolkRNN

英国ロンドン大学クイーンメアリ校(開発当時)のボブ・スターム氏らにより開発された作曲AI。
フォークソングをピアノ音声と楽譜で作製してくれますが、自由度はそこまで高くなさそう。
Riffusion

Stable Diffusionをスペクトログラム画像を生成するように調整し、オーディオに変換。
画像から音楽を作成するため、イラストAIとは違いテキストの内容が反映されるわけではない?
Jukebox…OpenAIが開発している作曲AI
文章AI
AIのべりすと

今回紹介したAIサービスの中では珍しく、日本語入力に対応している小説用サービス。
書き出しに対してAIが続きの文章を書いてくれるので、適宜修正すると小説が完成します。
ChatGPT

DALL-Eの開発元であるOpenAIが公開した文章用AIで、モデルはGPT-3.5を基にしています。
日本語にも対応しており、文章生成だけでなく悩みをAIに聞いてみるのも面白そうです。
https://chat.openai.com/auth/login
翻訳AI
Google翻訳

Googleが開発している翻訳サイトおよびツールで、もはや日常に溶け込んでいます。
あらゆる言語への翻訳が可能なほか、スプレッドシートの関数で翻訳を行う関数もアリ。
https://translate.google.co.jp/
DeepL

Google翻訳とは比べ物にならないレベルでの翻訳を行う、研究者なら常識のAI翻訳サイト。
この記事で紹介するAIは英語で文章を入力していますが、すべてDeepLで翻訳したものを使用。
https://www.deepl.com/ja/translator
音声読み上げ
studio. d-id

Stable Diffusionでアバターを生成して、GPT-3で文章作成して、動画を作成できるサイト。
サインインが必要ですが、日本語にも対応しておりディープフェイクなども増えそうな予感。
コメント