The State of Open Data 2023報告書:研究者への支援はいまだ不十分
2023年11月21日
世界各国の研究者6,000人以上を対象に調査を行い、Digital Science、Figshareとシュプリンガーネイチャーがまとめた報告書は、オープンデータの共有にまつわる課題が未解決であることや、次世代技術の影響について重要な証拠をあげています。
ロンドン|ベルリン|ニューヨーク 2023年11月14日
本日公開された第8回目の「The State of Open Data」年次報告書には、調査対象とした研究者の約4分の3という圧倒的多数が、オープンデータの共有に必要な支援をまだ受けていないと答えたと記載されています。この数字から、持続可能なオープンサイエンスの実践に向けて、研究コミュニティーの連携やツールをより一層強化する必要があることがわかります。
回答者の残り23%は、データの共有化に際して支援を求め、確保できたと回答しています。支援の提供元は、内部の情報源(同僚または上司)が最も多く(61%)、次いで機関図書館(31%)、研究室・研究機関内の専門知識(26%)、出版社(21%)、資金提供者(17%)の順になっています。
「The State of Open Data報告書は、オープンデータの確立、オープンデータへの取り組み姿勢、研究者によるデータ共有の体験を時系列で記載した、ほかに類を見ない、長期的に有用な資料となりました」、とDigital ScienceのCEOであるDaniel Hook氏が述べました。「本書を読んで、研究コミュニティーで今何が起こり、成し遂げられようとしているのか、また、今後どのような機会があるのかについて、理解を深めていただければと思います」
さらに、シュプリンガーネイチャーのChief Publishing OfficerであるHarsh Jegadeesan(ハーシュ・ジェガデサン)は次のように述べています。
「オープンリサーチに対する研究者の考え方をよりよく理解できれば、私たちが一つのコミュニティーとして、アクセスしやすい研究を進め、新しい技術の力を利用して、オープンサイエンスを推進していくために、皆で果たすべき役割を明確にできるでしょう。すべての研究の部分に容易、そして自由にアクセスできるようにすることで、研究へのアクセスや、利用、再利用が可能になります。これは、研究成果を誰でも入手できるようにし、入手した人たちが変化を起こして、世界が直面するもっとも重要な課題に対処できるようにする、という意味で重要なことです」
世界各国の研究者6,000人以上から回答が寄せられ、回答率はインド(12%)、中国(11%)、米国(9%)の順に高くなっています。今年度は初めて、データの収集・共有に人工知能(AI;Artificial Intelligence)を活用したことがあるか、回答者に尋ねました。現状では、調査対象とした研究者の約4分の3が、データをオープンにすることについて何の支援も受けていないと答えていますが、AIをデータ共有化の作業や、現状の取り組み方の評価に活用できるという可能性に着目すれば、研究エコシステム全体の関係者が、今後、AIが研究プロセスにどのような役割を果たせるのかを考えるようになるかもしれません。
今年の報告書に関するそのほかのおもな結果は次のとおりです。
- 回答者の60%は、データを共有してもほとんど評価されないと考えています。評価は依然として、研究者の懸案事項であり、過去8年間の報告書でも繰り返し取り上げられてきました。これは、研究者の意欲、信頼、協力関係を損ない、オープンサイエンスと持続可能なデータ共有の実践の推進を妨げる問題です。
- 研究データ管理については、国ごとに差異を考慮したアプローチを取る必要があります。万能な基準はありません。たとえば、研究データの公開を各国が義務づけることにはおおむね賛成(64%)が得られていますが、インドとドイツは、支持を表明する研究者の割合がほかの国よりも高いことがわかります(両国とも71%)。
- キャリアステージは、オープンデータの認識度と支持率を大きく左右する要素ではありません。オープンリサーチに関して議論、フォーラム、討論会を開催する場合は、誰もが参加できるように配慮する必要があります。
- AIを認識していても、実用にはいたっていません。回答者の約半数が、データの収集、処理、メタデータ作成に使用できる生成AIツールを認識していましたが、大半はまだ使用していないと答えています。
シュプリンガーネイチャーのOpen Data Program ManagerであるGraham Smith(グラハム・スミス)は、今年の結果について、次のように述べています。
「昨年論文を出版した研究者は、以前と比べ、資金提供者からの要求でデータを共有する傾向が顕著になっています。シュプリンガーネイチャーでは、当社のシングルデータに関する方針(single data policy)やデータ可用性の書面記載を求めるなど、研究者にデータ共有を促す具体的な対応を行なっています。そうすることで、著者がデータを公開し、データの再利用やそれに関する調査を進めることにつながると考えています」
Figshareの創設者およびCEOであるMark Hahnel氏は、次のように述べています。
「今年度の報告書では、進歩が見られると同時に、同じテーマも再度取り上げられています。しかし、今回は、国、研究テーマ、キャリアステージの違いによって、回答の一致率は高まるのか、あるいは明らかな差異があるのか、さらに調査を進めて確認しました。世界の資金提供者がFAIR[Findable(発見できる)、Accessible(アクセスできる)、Interoperable(相互運用できる)、Reusable(再利用できる)]データを推進し、研究者を世界的に同じ方向に向かわせているとはいえ、研究者の人柄や居住地といった変数によって、各人の行動に微妙な違いがあるのだと認めることが大切です」
本調査結果をさらに発展させるため、今年は中国科学院コンピュータ・ネットワーク情報センターが中国のオープンデータを調査したパートナー・レポートを初めて発表します。この報告書は、2023年11月30日に発行される予定です。
シュプリンガーネイチャーは、研究コミュニティーの積極的なパートナーであり、データ共有の新しいアプローチを開拓し、データ共有が新しい常識となるよう研究者を支援することに尽力しています。当社のオープンデータに関する取り組みついては、オープンデータのページをご覧ください。
The State of Open Data報告書のうち、日本からの回答をまとめた調査結果は次のとおりです。
- 回答者の 75%が、自分の研究論文を引用することでデータを公開する可能性が高まると回答し、 次いで論文の共著(51%)、完全なデータ の引用(45%)と回答しています。
- 回答者の 51%がデータ・マネージメント・プラン(DMP;Data Management Plan)という概念を知らないと回答しています。回答者の 43%が、データ・マネージメント・プランを作成したおもな理由の一つとして、「現在研究資金を得ている機関の要請」をあげており、次いで「所属機関の要請」(39%)と回答しています。
- データ・マネージメント・プランを実施するうえでの課題について尋ねたところ、回答者の 39%が「適切な訓練を受けたスタッフがいない」、次いで「技術的な課題(データの保管場所、データの整理方法)」(29%)と回答しています。
- 回答者の 63%が、アクセス、共有、再利用の方針をよりよく理解し、定義するために、さらなるスキル研修や情報提供が有益であると感じており、次いで長期保管やデータ管理戦略に関するスキル研修や情報提供が有益であると回答(57%)しています。
- 回答者の大多数(63%)が、研究データの公開に際して支援を必要とするおもな分野として「データの著作権/ライセンス」をあげています。次いで、61%が「データを管理する時間の確保」について支援を必要としていると回答しています。
- 回答者のうち、42%が研究データの公開を国家的に義務づけるというコンセプトを「強く支持する」または「ある程度支持する」と回答しています。
State of Open Dataレポートの全文は、Figshareで閲覧可能です。
URL: https://doi.org/10.6084/m9.figshare.24428194
また、続くCASレポートは、2023年11月末に提供される予定です。
本件につきまして、X (Twitter)において、ハッシュタグ #StateOfOpenData で議論をご確認いただけます。
編集者への注記:
今回の報告書のテーマをとおして得られたおもな結果:
- 必要な人のもとに支援が届いていない
オープンデータの方針策定や義務化が世界的に進み、研究データの計画、管理、共有に関する支援が重要になっているにもかかわらず、こうした支援を受けたことがないと答えた回答者は、全体の約4分の3にのぼりました。データ共有に関する支援を受けた人では、内部の同僚や上司など、非公式な情報源からの支援が最も多くなっています(61%)。そのほか研究者が支援を受けたのは、機関図書館(31%)、研究室・研究機関内の専門知識(26%)、出版社(21%)、資金提供者(17%)です。 - 万能な基準はない
地理的地域や学問領域によって回答にばらつきが見られることから、研究データ管理の支援については、国ごとに差異を考慮したアプローチを取る必要があります。特に、研究データの公開を各国が義務づけることには、おおむね賛成が得られていますが(64%)、インドとドイツは、支持を表明する研究者の割合がほかの国よりも高いことがわかります(両国とも71%)。 - 固定観念が課題
キャリアが長い研究者ほど進歩に反対すると思われがちですが、調査結果を見ると、キャリアステージが、データ公開の認識度と支持率を左右する大きな要素ではないことがわかります。オープンリサーチに関して議論、フォーラム、討論会を開催する場合は、誰もが参加できるように配慮する必要があります。 - いまだ残る評価の問題
研究者の間では、データを公開、共有しても充分な評価を受けられないという認識があり、それがいまだに懸案として残っていることが、8年連続で示されています。実際、回答者の60%は、データを共有してもほとんど評価されないと考えています。 - AIを認識していても、実用にはいたらず
今年度は初めて、データの収集、処理、メタデータの作成に、ChatGPTなどの生成AIツールを利用しているか、調査回答者に尋ねました。3つの質問すべてでもっとも多かったのは、「そのようなツールは知っているが、検討したことはない」という答えでした。AIツールやその応用技術は進化の速度が速いことから、The State of Open Dataの今後の調査でも、引き続きこのような形式で同分野の進展状況を評価していきます。
Digital Scienceについて
Digital Scienceは、研究者、大学、資金提供者、産業界、出版社が直面する複雑な課題に革新的なソリューションを提供するAIに特化したテクノロジー企業です。私たちは、社会の利益のためにグローバルな研究を推進するためにパートナーシップを組んでいます。Altmetric、Dimensions、Figshare、ReadCube、Symplectic、IFI CLAIMS Patent Services、Overleaf、Writefull、OntoChem、Scismic、metaphactsの各ブランドを通じて、私たちはともに問題を解決することで、すべての人に進歩をもたらすと信じています。詳細は、www.digital-science.com をご覧いただき、 @digitalsci および LinkedInをフォローしてください。
Figshareについて
Figshareは、研究機関向けのSoftware-as-a-Service型リポジトリーソリューションです。Figshareのインフラとグローバルなコミュニティーは、研究者が大規模なデータセットを含む研究成果を、発見できる・アクセスできる・相互運用できる・再利用できる(FAIR)な方法で共有および保存するためのプラットフォームを研究機関に提供します。Altmetricsと引用データを完備しており、研究者はすべての成果に対してクレジットを得ることができます。FigshareはDigital Scienceの一部です。詳細は、www.figshare.comをご覧いただき、 @figshareをフォローしてください。
シュプリンガーネイチャーについて
シュプリンガーネイチャーは、180年以上にわたり、研究コミュニティー全体へ最良のサービスを提供することによって発見の進展に貢献してきました。研究者が新しいアイデアを公開することを支援するとともに、出版するすべての研究が重要で着実であり、客観的な精査にも耐え、関心をもつすべての読者にもっとも良いフォーマットで届き、発見、アクセス、使用、再利用、および共有されるようにします。私たちは、テクノロジーやデータの革新を通じて図書館員や研究機関をサポートし、学会に出版を支援するための優良なサービスを提供します。
学術出版社として、シュプリンガーネイチャーは、シュプリンガー(Springer)、ネイチャーポートフォリオ(Nature Portfolio)、BMC、パルグレイブ・マクミラン(Palgrave Macmillan)、サイエンティフィック・アメリカン(Scientific American)などの信頼されたブランドを有しています。
詳しい情報は、springernature.com をご覧いただき、@SpringerNature のフォローをお願いいたします。
本件に関するお問い合わせ
宮﨑 亜矢子
シュプリンガーネイチャー
コーポレート・アフェアーズ
E-mail: ayako.miyazaki@springernature.com
※ 本プレスリリースの原本(一部を除いて)は英語であり、日本語は参考翻訳です。
The State of Open Data report 2023: Support for researchers still lacking