はじめに
私は学生時代Q&Aサイトのデータをもとに研究をしていました。というのが人に簡単に説明するときの一言です。ややこしく本質的には、人間がどのように情報入手をするのか、どうすれば知りたいことを知れるのか研究するというものでした。そのアプローチとして、Q&Aサイトのデータを分析していました。当時素晴らしい成果が出せたわけではないのですが、修論時に一応オチというか、方向性みたいなものを示すことができました。その方向性が今流行っているChatGPTに繋がって私の中で当時の研究が完了したなと思った、という話です。
情報要求の4階層
当時のオチにあたる部分なのですが、人間の情報入手は上図の4階層に整理できるとしました。最初は、漠然と情報が足りないと困った状態(Q1)で、あいまいな表現で具体化言語化(Q2)され、次第に問題が明確化され(Q3)、どうすればよいかも明確になる(Q4)、という情報入手を行う工程を構造化しています。この4階層を示したのはRobert S.Taylor氏が1968年に書いた論文*1になります。上図ではそこへ当時の情報入手手段として検索エンジンとQ&Aサイトを付加して、位置づけています。ポイントは、検索エンジンはQ3程度まで情報を具体化しないと必要な情報にアクセスできないという点です。ChatGPTが出た今考えると、検索エンジンは最大公約数的な結果しか得にくい、パーソナライズな結果は仕組み的に得にくいと強く思います。現状でもパーソナライズドされた検索結果画面が生成されていますが、それでも限界を感じます。さらにSEO(Search Engine Optimization)対策された低品質な情報が量産されており、なかなか厳しさもあります。もちろん上手く使えば今でも大変に有用であることは間違いないです。
本題です。情報要求の4階層にChatGPTを位置づけるとまさにQ&Aサイトと同じ位置になります。Q4の情報要求は欲しい情報が明確であるため、回答文ではなく解答を適切な手段で得れば良いのです。その手段としてChatGPTを利用することも可能ですが、それは主たる利用方法でないと考えます。この位置づけができた繋がったため、私の中で私の研究が完了したなと思いました。また、当時の論文で「人間の情報要求を満たすためには、問題の言語化ができるQ2までの情報要求に対応した情報入手支援が必要と考えられる。」*2と考察されており、それが実現しました。もちろん私の論文きっかけでChatGPTが開発されたわけでは全くないのですが、私達研究室の考えた方向性は間違っていなかったと思えたのが嬉しいなという気持ちです。また、当時指導教授が人間はいつかは情報入手手段は自然言語に戻るとおしゃっていました。私はその時半信半疑でしたが、今そうなりつつあり、やはり指導教授素晴らしい方だなと思います。
必要な情報が生成される
当時明記できていなかったこととして、入手する情報が生成されるという観点です。欲しい情報はどこかきっとインターネット上にあって、それを見つけるという観点でしか考えられていなかったです。ChatGPTも原理的には既存の情報を使っていますが、既存の情報を組み合わせて作られた情報も、ChatGPTレベルならば生成された新しい情報と言えると思います。ただの組み合わせであるか、新規生成な情報であるかの境界線は難しいですが。ここらへんの話は、落合陽一さんが言うデジタルネイチャーに繋がっていくのだと思います。落合さん曰く、2025年に自然の進化速度が人間の理解速度を超えるとのことです。以下動画で説明されていて、大変興味深いです。
www.youtube.com
おわりに
学生時代はもちろん楽しかったのですが、研究は最初から最後までスッキリできず迷走しきりでした。もちろんたくさんのことを学ぶこともできて、育ててくれた両親や周囲の方々には感謝しております。そしてふと最近、改めて自分の研究を解釈できて完了した感があったので、このように文章にした次第です。ここまでお読みいただきありがとうございました。
*1:[PDF] Question-Negotiation and Information Seeking in Libraries | Semantic Scholar図書館で情報入手する方法の研究から現代に繋がるのはエキサイティングと思います。