Skip to content
Published on

AI 科学研究 & 文献ツール 2026 完全ガイド - Elicit · Scite · Consensus · SciSpace · Semantic Scholar · Undermind · Perplexity · OpenAI Deep Research 徹底分析

Authors

プロローグ — 毎日 11,000 本の論文が流れ込む

学術論文の年間生産量は 2020 年にすでに 400 万本を超え、2026 年にはさらに加速した。1 日平均およそ 11,000 本。1 分野を全て読破することは、もう不可能な時代になって久しい。

博士課程の学生は文献レビューに 1 年を費やす。ポスドクは自分の分野が毎年 30% 拡大するのを見ている。学際研究に挑むと、二重三重の負荷がのしかかる。引用グラフはあまりに巨大で、もはや人間の頭で抱えきれない。

本稿はその危機に応えるツール地形を見る。検索・発見・統合・引用・管理・ライティング・検証まで ── 2026 年時点で実際に使われている AI ツールをカテゴリーごとに分解し、強み・弱み・価格・リスクを整理する。そして最も重要な問い: AI はどこで助け、どこで壊すのか


第1章 · なぜ今 AI 研究ツールなのか — 三つの圧力

2026 年の研究者を直撃した三つの圧力が AI ツール採用を強制した。

┌──────────────────────────────────────────────────────────────┐
│                                                              │
│  圧力 1 — 爆発                                                │
│   年間 400 万本以上、1 日 11,000 本                          │
│   分野が毎年 20-30% 拡大                                     │
│   人間の読書速度 = 横ばい                                    │
│                                                              │
├──────────────────────────────────────────────────────────────┤
│                                                              │
│  圧力 2 — 時間                                                │
│   PI は週平均 60-80 時間                                     │
│   博士 1 年目は文献レビューに約 600 時間                     │
│   1 本を深く読むのに 30 分、メタ分析は 200-500 本            │
│                                                              │
├──────────────────────────────────────────────────────────────┤
│                                                              │
│  圧力 3 — 学際性                                              │
│   AI / 生物 / 医学が融合 → 複数分野の追跡                    │
│   各分野ごとに用語・基準が異なる                             │
│   人間の脳では追いつかない                                   │
│                                                              │
└──────────────────────────────────────────────────────────────┘

三つの圧力はいずれも、人間が速く読むだけでは解けない。ツールが 統合・要約・引用グラフの追跡・エビデンス評価 を一部肩代わりするしかない。それが 2026 年の現実だ。


第2章 · 検索 + 発見 — Semantic Scholar、Google Scholar、OpenAlex、CORE

文献作業は常に検索から始まる。2026 年時点の検索インフラは次のとおり。

ツール運営規模強み弱み
Semantic ScholarAllen Institute (AI2)2 億本以上TLDR 要約、推薦、無料 APIUI は地味
Google ScholarGoogleほぼ全領域到達性、引用カウント、PDF リンクAPI なし、データクローズド
OpenAlexOurResearch / CWTS2.5 億以上完全オープン、引用グラフ無料一部データにノイズ
COREThe Open University3 億以上(OA 中心)オープンアクセス集約、全文検索UI が重い
Microsoft AcademicMicrosoft(2021 終了)(歴史的)クローズド、OpenAlex に移行
PubMed / MEDLINENIH/NLM3,800 万以上生物医学標準、MeSH 索引分野限定
BASEBielefeld3 億以上多言語 OA学術的なインターフェース

最大の変化は Microsoft Academic の終了(2021) の後、その座を OpenAlex が継いだことだ。OurResearch (CWTS) が運営し、全データが CC0 である。学術引用グラフ分析に挑むほぼ全ての新ツールが OpenAlex や Semantic Scholar の上に構築される。

Semantic Scholar は単純な検索を越える。AI2 が作った TLDR 要約、推薦システム、S2ORC コーパスの公開まで ── 事実上、学術 AI の「ハブ」となった。

Google Scholar は到達性こそ圧倒的だが、API がなく、引用データが外に出ない。2026 年でも個人研究者の最初の検索はここから始まるが、下流ツールは OpenAlex / Semantic Scholar の上に乗る。


第3章 · Elicit — エビデンス統合アシスタント

Elicit は Ought の中で生まれ、2024 年に独立した。「AI 研究アシスタント」カテゴリーの代表格である。

何ができるのか

  • 自然言語の質問 → 関連論文の検索
  • 各論文から自動抽出: 結果、手法、サンプルサイズ、限界
  • 結果を 表形式 で統合(システマティックレビューのワークフロー)
  • 引用トラッキング、PDF アップロード可

価格(2026 時点)

  • Free: 月 5,000 クレジット
  • Plus: 月 12 ドル、ワークフロー追加
  • Pro: 月 42 ドル、無制限抽出
  • Team / Enterprise

いつ使うか

  • メタ分析、システマティックレビューの初期段階
  • 「この仮説を支持するエビデンスはどれくらいあるか」という問い
  • 50-300 本を素早くスキャンし、深く読む 5-10 本を選ぶ

弱み

  • 抽出が常に正確とは限らない ── サンプルサイズや効果量を見間違うことがある
  • 非英語論文に弱い
  • 出力は出発点であり終点ではない ── 原文検証が必須

Elicit の真の価値は「初期スクリーニングの 50 倍加速」だ。200 本を 30 分以内に表に整理する。だが、その表を見て どう結論を下すか は依然として人間の仕事だ。


第4章 · Scite.ai — スマート引用(支持 vs 反論)

Scite は引用分析に特化して最も深掘りしているツールだ。引用が本文中でどのような文脈で使われたか を分類する。

スマート引用の分類

  • Supporting — 引用された主張を支持
  • Mentioning — 単純な言及
  • Contrasting — 主張に反論

なぜ重要か

論文 X が 1,000 回引用されたからといって X が正しいわけではない。そのうち 50 回は X が誤りだと主張する引用かもしれない。通常の引用カウントはこれを見ない。

価格(2026)

  • Personal: 月 20 ドル
  • Team: 月 25 ドル / ユーザー
  • 学生割引 50%

ワークフロー統合

  • Zotero プラグイン ── ライブラリから直接スマート引用を確認
  • Word プラグイン ── 執筆中に引用を検証
  • ブラウザ拡張 ── PubMed/Google Scholar にオーバーレイ

Scite の限界: 引用分類の精度は約 90% だが、微妙な批判(例: 「限られたサンプルでのみ有効」)は常に捕まえられるわけではない。


第5章 · Consensus — コンセンサス検索

Consensus はより軽量で消費者向けのツールだ。「このトピックに関する学界のコンセンサスは?」という問いに答える。

コア機能

  • 自然言語の質問入力(「コーヒーは心血管の健康に良いか?」)
  • 最も関連性の高い論文 8-20 本を抽出
  • 各論文の結論を YES / NO / POSSIBLY で一行要約
  • 「Consensus Meter」── 合意の分布を可視化

価格(2026)

  • Free: 検索制限あり
  • Premium: 月 10 ドル

よく合うケース

  • 患者が医師に尋ねる前のセルフチェック
  • 講演・ブログ用の素早いコンセンサス確認
  • 学部生の初期リサーチ

限界

  • 医学・健康分野に強いが、他分野は平凡
  • 「Consensus Meter」は単純化のリスク ── n=20 のコンセンサスは分野全体のコンセンサスではない

第6章 · SciSpace (Typeset) — Copilot for Papers

SciSpace はインド発のスタートアップで、「論文 1 本を深く理解する」ことに集中する。

機能

  • PDF アップロード → チャットインターフェースで質問
  • 数式の説明、図の解釈、表の解読
  • 多言語(韓・日・中・アラビア語など)
  • 引用検索、関連論文推薦
  • 「Literature Review Assistant」── 表形式での比較

価格(2026)

  • Free: チャット制限
  • Premium: 月 20 ドル
  • Team プラン

Elicit との比較

  • Elicit は 数十-数百本の統合 に強い
  • SciSpace は 1 本を深く理解 することに強い
  • 併用すると相互補完的

弱み

  • 深い数学(証明検証)に弱い
  • 最新論文(arXiv 即時反映)に遅延

第7章 · Undermind — エージェントベースのディープ検索

Undermind は 2024 年に MIT 出身者が作った「AI 研究エージェント」だ。他のツールがキーワード一致を高速に行うのに対し、Undermind は 5-10 分間自律的に探索する

動作方式

  1. ユーザーが自然言語の質問を入力
  2. エージェントが一次検索 → 結果を読む → 新キーワードを発見
  3. 二次・三次検索を自動で繰り返す
  4. 結果をクラスタリングし、研究レポート形式 で出力

価格(2026)

  • Free: 月数回
  • Plus / Pro

いつ使うか

  • 「自分が知らない分野」に初めて入るとき
  • キーワードを知らない領域の文献マッピング
  • 時間があるなら、1 時間かけて深く探索

弱み

  • 5-10 分の待機 ── 速い回答には不向き
  • 出典検証は依然として人間の仕事
  • 分野が非常に特殊だと表層的になる

Undermind は Elicit の従兄弟だが、より「自律的」だ。結果の深さは優れるが、決定論性は劣る。


第8章 · Perplexity Pro Research — 推論モデル + ウェブ

Perplexity Pro は一般的な AI 検索だが、「Research」モードを別途持っている。

Research モードの特徴

  • Sonar Pro / GPT-5 / Claude 4.6 などの推論モデル使用
  • 多段階検索 → 50-100 の出典を統合
  • 学術ソースの重み付けオプション
  • PDF 出力可

価格(2026)

  • Pro: 月 20 ドル

Elicit / Undermind との対比

  • Perplexity は ウェブ全体 が対象、学術は一部
  • 学術の深さは Elicit / Undermind より浅い
  • 代わりに 現実世界のコンテキスト(ニュース、ブログ、コード)も一緒に見られる強み

学術単独レビューには不足するかもしれないが、市場・技術・政策の文脈が混じる質問 には Perplexity の方が向く。


第9章 · OpenAI Deep Research — 自律研究エージェント

OpenAI が 2025 年 2 月にリリースした Deep Research は o3 ベースの自律エージェントだ。2026 年には GPT-5 Research に進化した。

特徴

  • ユーザー質問 → 5-30 分の自律調査
  • 数百のウェブページ / 論文を読み、推論し、レポート作成
  • 引用を表形式で添付
  • 図表生成可

価格

  • Pro プラン(月 200 ドル)のコア機能
  • Plus プラン(月 20 ドル)でも月 10 回提供

学術利用

  • 市場調査・競合分析に非常に強い
  • 学術のみなら Elicit / Undermind より浅い可能性
  • ただし 複数分野の統合レポート では最強

リスク

  • ハルシネーション引用が報告されている(特に偽の arXiv ID)
  • 必ず原文をクリックして検証
  • スタンスは「下書きの自動化」であり「最終レポート」ではない

第10章 · Google Gemini Deep Research — 長コンテキスト多重ソース

Google の Gemini 2 Deep Research は OpenAI 版と競合する。違いはコンテキスト長だ。

強み

  • Gemini の 2M トークンコンテキストを活用
  • 一度に数百ページの論文 PDF をまるごと読む
  • Workspace 統合(Drive、Docs に出力)

弱み

  • 学術引用の精度が OpenAI / Anthropic よりわずかに低い(ベンチマーク次第)
  • 深い数学・証明に弱い

価格

  • Gemini Advanced: 月 20 ドル
  • Workspace Enterprise

第11章 · Anthropic Claude + Web Search — ツール使用型研究

Anthropic は別途「Deep Research」製品をマーケティングしていない。代わりに Claude の tool use + web search で同等以上の結果を出す。

ワークフロー

  • Claude.ai に質問入力
  • Claude が web search ツールを呼ぶ
  • 結果を読み、追加検索を判断
  • レポートを Markdown で出力(Artifacts)

強み

  • 2026 年ベンチマークの一部基準で引用精度が最高との評価
  • 推論チェーンが透明(extended thinking)
  • API で自前エージェント構築可

価格

  • Claude Pro: 月 20 ドル
  • Claude Max: 月 100-200 ドル(使用量別)
  • API は別途

第12章 · 文献管理 — Zotero 7、EndNote、Mendeley、Paperpile、JabRef

検索・統合ツールが進化しても 参照文献管理 は依然として別カテゴリーだ。

ツール運営価格強み弱み
Zotero 7非営利 (CHNM)無料(ストレージは有料)オープンソース、プラグイン豊富、ZotFile / Better BibTeXUI が古め
EndNote 21Clarivate300 ドル一括学術機関の標準、Word 統合クローズド、高額
Mendeley Reference ManagerElsevier無料Elsevier DB 統合デスクトップアプリ終了、Web のみ
PaperpilePaperpile LLC年 36 ドルGoogle Docs / Drive 統合非英語圏に弱い
JabRefJabRef Devs無料BibTeX 標準、LaTeX フレンドリーUI が重い
ReadCube PapersReadCube月 5-10 ドルきれいな UI価格
CitaviQSR Intl179 ドルドイツ圏の標準、知識整理が強い終息の兆し

2026 年の推奨は Zotero 7 + Better BibTeX + Zotero Connector。これに ZotFile で PDF 整理、Scite プラグイン で引用検証を足せば、ほぼ全ケースをカバーできる。

Mendeley は 2026 年で実質下り坂。デスクトップアプリが死に、Elsevier は自社統合のみに集中している。学生・研究者は Zotero への移行が正解だ。


第13章 · 学術ライティング支援 — Trinka、Paperpal、Grammarly、DeepL Write

論文執筆そのものを助けるツールは独立カテゴリーだ。

学術特化

  • Trinka ── 学術英語特化、医学・工学の用語に強い
  • Paperpal ── Cactus Communications、剽窃 + AI ライティング補助
  • Writefull ── Overleaf 統合、学術英語パターン
  • Jenni AI ── 学生向け、引用自動挿入

一般(学術補助で使用)

  • Grammarly ── 最も普及、英語の基本
  • Wordtune ── 言い換え、トーン調整
  • DeepL Write ── 独/欧で強い、非英語圏の自然さ

価格(2026)

  • Trinka Premium: 月 20 ドル
  • Paperpal Prime: 月 19 ドル
  • Grammarly Premium: 月 30 ドル
  • DeepL Pro: 月 9 ドル

Tip: 英語が母語でない研究者にとって最高 ROI は DeepL Write + Trinka の組み合わせ だ。DeepL が自然な英語を、Trinka が学術コンベンションを押さえてくれる。


第14章 · 剽窃 + AI 検出 — iThenticate、Turnitin、GPTZero、Originality.ai

学術出版の両端 ── 剽窃検出AI 執筆検出 ── どちらにも業界標準がある。

剽窃検出

  • iThenticate ── Crossref Similarity Check のバックエンド、学術出版社の標準
  • Turnitin ── 教育機関の標準(学部・大学院)
  • PlagScanCopyleaksPlagium ── 補助

AI 検出(2026 時点の信頼度)

  • Turnitin AI Detection ── 学校の標準
  • GPTZero ── 人気の消費者ツール
  • Originality.ai ── SEO / コンテンツ市場で強い
  • Copyleaks AI Detector ── 多言語
  • Pangram ── 新規参入

重要な真実: 2026 年でも AI 検出の 偽陽性率(人間を AI と誤判定) が学術ライティングで 5-15% ある。非英語圏の学生がより多く誤判定される。AI 検出結果だけを根拠に処罰すべきでないというのが出版倫理委員会(COPE)の立場だ。


第15章 · 図・グラフ — Matplotlib、Seaborn、Plotly、Vega-Altair

論文の図は依然としてコードで作る。2026 年の標準は次のとおり。

ライブラリ言語強み弱み
MatplotlibPython学術標準、ほぼ全種類デフォルトが地味
SeabornPython統計図特化、きれいなデフォルトMatplotlib 上なので制約も継承
PlotlyPython / R / JSインタラクティブ、発表向き印刷 PDF だと違和感
Vega-AltairPython宣言的文法、再現性コミュニティが小さい
ggplot2R統計図のゴールドスタンダードR 限定
D3.jsJavaScript完全カスタム学習曲線が急

学術 PDF 出版が目標なら Matplotlib + Seaborn が依然として無難。データ探索のインタラクティブには Plotly、統計チャートは ggplot2 が圧倒的だ。

AI 補助: Claude / ChatGPT は Matplotlib コードの作成が非常に上手い。「このデータを箱ひげ図で描いて」と一行で 80% のコードが出てくる。


第16章 · 再現性 — Jupyter、Quarto、Marimo

論文付録のコードは徐々に標準化が進んでいる。

  • Jupyter ── 事実上の標準、学術データ分析の共通語
  • Quarto ── RStudio が作った多言語ドキュメントシステム、論文丸ごと作成可
  • Marimo ── 次世代 Python ノートブック、リアクティブ、再現性重視
  • R Markdown ── R エコシステムの標準
  • Pluto.jl ── Julia ノートブック

Quarto の登場が最大の変化だ。R / Python / Julia を一つの文書に混ぜ、PDF・HTML・docx・revealjs スライドまで全部出力する。JoSS (Journal of Open Source Software) のようなジャーナルが Quarto ベース投稿を許容している。

ResearchHubStencilaCurvenote のような「実行可能な論文」プラットフォームも育っているが、まだ主流ではない。


第17章 · arXiv エコシステム — alphaXiv、HuggingFace Papers、arxiv-sanity

arXiv は 1991 年から運営されているプレプリントサーバーだ。2026 年時点で月 20 万本の新規アップロード。

arXiv 本体

  • コーネル大学運営、Simons Foundation 支援
  • 数学・物理・CS・生物などほぼ全分野
  • ライセンスモデルが明確(CC BY など)

arXiv 補助ツール

  • arxiv-sanity-lite (Karpathy) ── 個別化推薦、RSS 風
  • arxiv-vanity ── 2023 年に実質停止
  • alphaXiv ── 論文に対するディスカッション / アノテーション層
  • HuggingFace Papers ── daily papers キュレーション、コミュニティ議論
  • Papers with Code ── Meta 運営、2025 年に段階縮小
  • PaperSwap ── 新規参入、推薦アルゴリズムが差別化

alphaXiv が 2024-2025 年に最も急成長したツールだ。arXiv URL の「arxiv.org」を「alphaxiv.org」に変えると、同じ論文のディスカッションページが開く。

HuggingFace Papers はデイリーキュレーションが核だ。毎日 5-15 本の「今日の論文」をコミュニティ投票で選ぶ。AI 分野に限定されるが、圧縮率は非常に高い。


第18章 · 分野別プレプリントサーバー — bioRxiv、medRxiv、ChemRxiv、SocArXiv

arXiv モデルが分野別に拡張された。

サーバー分野運営備考
bioRxiv生命科学CSHL2013 発足、COVID 後に大衆化
medRxiv医学CSHL/Yale/BMJ2019、COVID 期の中核チャネル
ChemRxiv化学ACS/RSC2017
SocArXiv社会科学OSF/COS2016
PsyArXiv心理学OSF2016
EarthArXiv地球科学コミュニティ2017
EngrXiv工学OSF2016
arXiv数学・物理・CS・一部生物Cornell1991

PubMed (NLM) は査読後の索引化だが、LitCovid のように一部プレプリントも統合する。MEDLINE は医学索引のゴールドスタンダード。


第19章 · 韓国 — KCI、DBpia、RISS、Naver Academic

韓国の学術インフラは英文グローバルシステムとは別に運営されている。

  • KCI (Korea Citation Index) ── 韓国研究財団 (NRF) 運営、韓国学術誌の索引
  • DBpia ── Nuri Media 運営、有料フルテキスト
  • RISS ── KERIS 運営、学位論文・刊行物・海外学術の統合
  • Naver Academic ── Naver の検索、韓国・海外統合
  • Kiss(韓国学術情報) ── 補助

Scinapse は韓国のスタートアップ Pluto Network が作ったグローバル学術検索だったが、2023 年に終了した。

2026 年の韓国研究者への推奨は次のとおり。

  • グローバル: Semantic Scholar + Elicit + Zotero
  • 国内: RISS + DBpia、KCI 索引確認
  • 韓国語論文向け AI ツールはまだ脆弱 ── Upstage Solar、NAVER HyperCLOVA X による自社構築が試みられている

第20章 · 日本 — J-STAGE、CiNii、NDL、JST

日本の学術インフラは政府主導が強い。

  • J-STAGE ── JST 運営、日本学術誌の無料フルテキスト(多くが OA)
  • CiNii ── NII (国立情報学研究所) 運営、学術・図書・博士論文を統合
  • NDL Search ── 国立国会図書館、図書・論文・記事
  • JST ── 科学技術振興機構、J-GLOBAL を運営

J-STAGE は世界的にも珍しい「政府が運営する巨大 OA ジャーナルホスト」だ。4,000 ほどの学術誌のフルテキストが無料で公開されている。

Sakana AIPreferred Networks が日本語学術 LLM を作っているが、学術検索サービスとしてはまだ発展途上だ。


第21章 · AI ハルシネーション引用 — 最も危険な罠

2026 年時点で AI 研究ツールの最大の罠は ハルシネーション引用 だ。

ハルシネーションのタイプ

  1. 存在しない論文 ── もっともらしいタイトル・著者・DOI を作り出す
  2. 実在する論文、誤った主張の帰属 ── 実際の著者が言っていない内容を引用
  3. 実在する論文、誤ったページ / 年
  4. 要約は合っているが強度を盛る ── 「強いエビデンス」と書くが原文は「暫定的」

なぜ起きるのか

  • LLM は統計的パターンであり、事実データベースではない
  • 引用形式(「Smith et al., 2019」)は学習データで頻出なので、もっともらしく生成される
  • DOI 形式も学習済みなので、「10.xxxx/yyyy」のパターンを作り出せる

対応

  • 全ての引用はクリックして検証
  • DOI は doi.org で実際に解決されるか確認
  • 本文に引用された主張が実際に原文にあるか確認
  • AI は「下書き」であり「最終」ではない ── 引用検証の責任は研究者

最近の事例

  • 2023 年、米国の弁護士が ChatGPT 製の偽判例を法廷に提出 → 懲戒
  • 2024 年、一部学術論文がハルシネーション引用で撤回
  • 2025 年、OpenAI Deep Research が偽の arXiv ID を引用した事例が報告

第22章 · 再現性危機 — AI は解決するのか、悪化させるのか

心理学・生物医学分野の 再現性危機 は 10 年以上学界の議題だ。AI は両刃の剣である。

AI が助ける側面

  • メタ分析を高速化 → 弱い効果をより精度良く検出
  • 統計検定の誤用をパターンマッチングで発見
  • コード / データ共有を自動チェック(ResearchHub の reproducibility badge など)
  • プレレジ(事前登録)の作成補助

AI が壊す側面

  • 偽データ生成が容易に → p-ハッキングの自動化リスク
  • AI 製の論文ドラフトがジャーナルプールに流れ込む
  • ハルシネーション引用が連鎖的に他論文へ伝播
  • 「AI がレビューしたから正しい」という誤った信頼

学界の合意は徐々に強まる ── AI は補助、責任は人間の著者 だ。ICMJE(国際医学雑誌編集者委員会)、COPE、主要出版社が全てこの立場である。


第23章 · 誰が何を使うべきか — シナリオ別推奨

学部生 / 修士初期

  • 検索: Google Scholar + Semantic Scholar
  • 統合: Consensus(簡単)、Elicit Free
  • 管理: Zotero 7 無料
  • ライティング: Grammarly + DeepL Write
  • 費用: ほぼ無料

博士課程 / ポスドク

  • 検索: Semantic Scholar + Elicit Plus
  • メタ分析: Elicit Plus または Pro
  • 引用分析: Scite(月 20 ドル)
  • 管理: Zotero + Better BibTeX + Scite プラグイン
  • ライティング: Trinka または Paperpal
  • 費用: 月 50-70 ドル

PI / シニア研究者

  • 検索: Elicit Pro + Undermind + Perplexity Pro
  • 自律調査: OpenAI Deep Research、Gemini Deep Research
  • 引用分析: Scite Team
  • 管理: Zotero + チームライブラリ、または EndNote(伝統的機関)
  • ライティング: Trinka + Grammarly Premium
  • 費用: 月 200-300 ドル

学際的研究者

  • 広範な検索: Undermind + Perplexity Pro Research
  • 分野別深掘り: Elicit + 分野別 DB(PubMed、IEEE Xplore)
  • 引用グラフ: OpenAlex API + Litmaps
  • 費用: 月 50-100 ドル

医学 / 臨床研究者

  • 検索: PubMed + Consensus + Elicit
  • 引用分析: Scite
  • ライティング: Trinka(医学特化)または Paperpal
  • 管理: EndNote(機関標準なら)または Zotero
  • 費用: 月 50-150 ドル

非英語圏研究者

  • ライティングの核: DeepL Write + Trinka の組み合わせ
  • 検索: Semantic Scholar(API ベースで自前ツール構築可)
  • 韓国: + RISS、DBpia / 日本: + J-STAGE、CiNii
  • AI 検出の偽陽性に注意 ── 5-15%

第24章 · 統合ワークフロー — 2026 年の研究者の 1 日

午前 9 時
  └─ HuggingFace Papers / alphaXiv の新論文キュレーションを確認
     (5 分、その日の分野トップ 5 本をメモ)

午前 10 時
  └─ Elicit で昨日始めたメタ分析の表をレビュー
     (50 本の抽出結果を 30 分検証、深く読む 10 本を候補としてマーク)

午前 11 時
  └─ SciSpace でコア論文 1 本を深く読む
     (数式の説明は SciSpace チャット、メモは Obsidian へ)

午後 1 時
  └─ Zotero に PDF 保存、Scite プラグインで引用文脈を確認
     (支持 / 反論比率が意外なら、より深く調査)

午後 3 時
  └─ 自分の執筆 ── Quarto または Overleaf
     (Trinka で英語を磨き、DeepL Write で自然さを)

午後 5 時
  └─ Claude / ChatGPT に結論段落の下書きを依頼
     (絶対に引用の自動生成は受けない ── ハルシネーション危険)

  └─ Undermind に「明日探索する質問」を投げる
     (5-10 分の自律探索、結果は明日レビュー)

このワークフローは、ツールが人の 時間 を節約するが 判断 は決して代替しないという原則の上で回る。200 本を表にする 30 分、深く読む 10 本を選ぶ 10 分、深読み 3 時間 ── この比率が重要だ。


エピローグ — AI はツール、責任は人

研究そのものの本質は変わらない。新しい問いを立て、エビデンスを集め、慎重に推論し、同僚に検証してもらう。AI はそのうち 集める ことと 要約する ことを加速するだけだ。

覚えておくべき三つ。

  1. 全ての AI 引用は検証。ハルシネーションは統計的に起きる。
  2. AI は下書き、人間が最終。出版された論文の責任は 100% 著者にある。
  3. ツールスタックは進化する。2024 年の正解は 2026 年の次善だ。毎年カテゴリーを再評価せよ。

「巨人の肩の上に立つ」── ニュートンの言葉だが、2026 年にはその上に AI というはしごがもう一段乗った。はしごは速く持ち上げてくれるが、崩れればもっと深く落ちる。

良い研究はツールと懐疑主義が共に進む。AI 時代には、後者の方が重要になる。


参考 / References