ネットワークベースのフレームワークを用いた自由記述式アンケート回答の民主的な分類
Democratic classification of free-format survey responses with a network-based framework
2019年7月9日 Nature Machine Intelligence 1 : 7 doi: 10.1038/s42256-019-0071-y
社会調査アンケートは、人々の意見を把握する手段として昔から広く用いられてきた。自由記述形式による方法は、選択肢形式よりも好ましい場合があるにも関わらず、利用されることは少ない。人手による解析を通常必要とするためである。大規模調査においては、自由記述回答文の分類は、途方もない作業になる上、分析者の解釈の影響を受ける可能性もある。本研究では、統計的な原理から回答を自動的に分類する、ネットワークベースのアンケート手法を提案する。これは各回答者が、回答の記述に加えて、他の回答との間の類似性も評価することによって実現される。我々は実例として、2016年アメリカ大統領選挙に関する調査と、ある大学の卒業生を対象として行った調査の結果を示す。この手法は、分析者が大規模調査の回答を集計し、意味を読み解く手助けとなる。
Corresponding Author
川本達郎
国立研究開発法人産業技術総合研究所
Social surveys have been widely used as a method of obtaining public opinion. Sometimes, it is more ideal to collect opinions by presenting questions in free-response formats than in multiple-choice formats. Despite their advantages, free-response questions are rarely used in practice because they usually require manual analysis. Therefore, classification of free-format texts can present a formidable task in large-scale surveys and can be influenced by the interpretation of analysts. In this study, we propose a network-based survey framework in which responses are automatically classified in a statistically principled manner. This can be achieved because, in addition to the text, similarities among responses are also assessed by each respondent. We demonstrate our approach using a poll on the 2016 US presidential election and a survey taken by graduates of a particular university. The proposed approach helps analysts interpret the underlying semantics of responses in large-scale surveys.