日本語の持つ言語的特徴に着目し、日本語の文体・位相の特徴や差異を、生成AIがどのように捉え、画像生成にあたってどのようなプロンプトを生成し、最終的にはどう画像に反映させるか、文学テクスト(『枕草子』春の段)の様々な現代語訳を用いて観察した。またAIが生成するプロンプトおよび画像を分析することで、言語表現と視覚表現の接点を客観的にとらえられるとし、将来的に、生成プロンプトや画像は文体の印象を示唆する「目安」となり得るかについても検討を行った。
今回の検証から、ChatGPTは日本語テクストの文体・位相差を繊細に読み取り、生成プロンプトに出力できているため、生成プロンプトは文体の印象を示唆する「目安」になり得る可能性はあると考えられる。DALL-Eは顕著な文体・位相差は反映できるが、「微妙な文体ニュアンス」を画像に反映することには限界がある(現段階ではDALL-Eの画像生成能力がChatGPTに追い付いていない)ということが確認された。今後、方法論の構築・整備と生成AIの進化を前提としたうえで、研究の補助ツールとして複数の翻訳・現代語訳研究、文体論・語用論、会話コーパス研究など、言語と視覚表現を架橋する研究への応用も期待できよう。