
はじめに:日本は「データ後進国」なのか?
「日本はIT後進国だ」「デジタル敗戦国だ」――そんな言葉が、メディアや識者の口から何度も語られてきた。COVID-19のパンデミックでは、保健所のFAX運用が世界中で嘲笑され、マイナンバーカードの普及率の低さが批判され、行政のデジタル化の遅れが連日報道された。こうした報道を目にするたび、多くの日本人は複雑な感情を抱く。怒り、恥ずかしさ、そして――違和感。
本当にそうだろうか?
日本には世界でも類を見ないほど、質の高い公共データが存在する。それも、驚くほど大量に。戦後から現在までの映像・音声・文書・統計・行政記録。これらは単なる「データの集積」ではない。日本社会が歩んできた道のり、人々の暮らし、思想の変遷、災害の記憶、技術の進化――すべてが記録されている。
その象徴が、NHKアーカイブであり、全国の自治体システムだ。
NHKアーカイブには、放送開始から現在までの膨大な映像と音声が保管されている。自治体のシステムには、住民の生活を支える情報が細かく記録されている。どちらも、本来なら「国民の共有財産」として、教育・研究・文化・政策立案に活用されるべきものだ。
しかし、現実はどうか。
NHKアーカイブの大半は「存在しているのに見られない」。自治体システムは「同じような機能なのに、自治体ごとにバラバラで高コスト」。つまり、宝の山が、宝のまま眠っているのである。
問題は「データがない」ことではない。問題は――データを活かす仕組みと覚悟がないことにある。
技術的には可能なことが、制度的・政治的・文化的な理由で実現しない。責任の所在が曖昧で、誰も決断できない。前例がないから動けない。こうした構造的な問題が、日本の公共データ活用を阻んでいる。
本記事では、
- NHKアーカイブのAI活用が何を可能にし、何につまずいているのか
- 自治体システムがなぜ非効率になり、なぜオープンソース化が進まないのか
- その2つが、実は同じ構造的問題を抱えている理由
を、技術論ではなく社会構造の視点から掘り下げていく。
そして最後に、日本が本当に問われているのは「技術力」ではなく、「自らの知をどう扱う国なのか」という根本的な問いであることを明らかにしたい。
第1章|NHKアーカイブとは何か――「眠る知のインフラ」
1-1. アーカイブの規模と内容
NHKアーカイブには、放送開始以降の膨大な映像・音声・資料が保管されている。その数は、公式に発表されているだけでも約100万本以上。ラジオの音声記録も含めれば、さらに膨大な量になる。
そこには何が含まれているのか。
- 戦後復興の記録 ― 焼け跡から立ち上がる人々、復興事業の現場、米軍占領下の日常
- 高度経済成長の現場 ― 東京オリンピック、大阪万博、新幹線開業、工業地帯の拡大
- 災害・事件・政治 ― 関東大震災の記録映像、学生運動、オイルショック、バブル経済、阪神・淡路大震災、東日本大震災
- 文化とエンターテインメント ― 紅白歌合戦、大河ドラマ、朝ドラ、歌番組、バラエティ
- 無名の市井の人々の声 ― 街頭インタビュー、地方の祭り、日常の暮らし、方言、失われた風景
これは単なるテレビ番組の保管庫ではない。日本社会そのものの記憶装置だ。
1-2. なぜアーカイブは「社会の記憶装置」なのか
人間の記憶は曖昧だ。時間が経てば、美化されたり、歪められたり、忘れ去られたりする。しかし、映像と音声は嘘をつかない。そこには、当時の空気、言葉遣い、表情、街並み、服装、価値観がそのまま残っている。
たとえば、1960年代の街頭インタビュー映像を見ると、人々の話し方が今とまったく違うことに驚く。敬語の使い方、語尾の抑揚、笑い方、視線の動き――すべてが「当時の空気」を伝えている。
あるいは、1980年代のバラエティ番組を見ると、今では放送できないような表現が平然と使われていることに気づく。それは「昔の人が無知だった」という話ではない。社会の価値観が変わったという証拠なのだ。
こうした記録は、歴史学者や社会学者にとって一級資料である。しかし同時に、教育現場でも、地域の郷土史研究でも、クリエイティブ産業でも、観光振興でも、活用できる可能性を秘めている。
1-3. ところが、その多くは「存在しているのに使えない」
NHKアーカイブは、埼玉県川口市の巨大な施設に保管されている。施設自体は一般公開されており、来館者は一部の番組を視聴することができる。しかし、ここで問題が生じる。
「何がどこにあるのか、わからない」
映像は保管されている。しかし、その内容を詳細に検索することができない。理由は単純だった。検索できないからだ。
もちろん、番組タイトルや放送日、出演者の名前などの基本情報は記録されている。しかし、「番組の中で誰が何を話したか」「どんな映像が何分何秒に出てくるか」といった細かい情報は、ほとんど記録されていない。
これは、アーカイブが作られた時代の技術的限界によるものだ。映像を一本一本再生して、人が手作業で内容を書き起こし、タグを付けるには、膨大な時間と人手が必要だった。実際、NHKの職員が必死にメタデータを整備してきたが、100万本以上の映像すべてに対応するのは、物理的に不可能だった。
結果として、「貴重な映像が埋もれたまま」という状態が続いてきた。
たとえば、ある研究者が「1970年代の地方都市の商店街の様子を知りたい」と思っても、該当する映像を探し出すのは至難の業だった。番組タイトルに「商店街」と入っていなければ、検索に引っかからない。番組の中にたまたま商店街の映像が出てきても、それを知る手段がない。
これは、図書館に膨大な蔵書があるのに、目録が整っていない状態に似ている。本は存在する。しかし、探せない。
第2章|AIが変えた「アーカイブ活用」の前提条件
2-1. かつてアーカイブ活用は、人海戦術だった
かつて、映像アーカイブの活用は極めて限定的だった。なぜなら、内容を把握するには、人間が一本一本視聴するしかなかったからだ。
- 映像を再生し
- 聞き取り
- 手で書き起こし
- 人がタグを付ける
この作業を100万本に対して行うのは、現実的ではない。仮に1本の映像に1時間かかるとすれば、100万時間――つまり、114年分の作業時間が必要になる。しかも、それは一人が休まず作業を続けた場合の話だ。
このため、NHKアーカイブでメタデータが整備されているのは、主に「重要な番組」や「頻繁に再利用される映像」に限られていた。つまり、大半の映像は「眠ったまま」になっていた。
2-2. AIはこの前提を破壊した
ところが、2010年代後半から状況が一変する。AI技術、特に音声認識と画像認識の精度が劇的に向上したのだ。
音声認識技術は、映像の音声を自動的にテキストに変換できるようになった。しかも、かつては「標準語のみ」「ノイズに弱い」といった限界があったが、最新のAIは方言やノイズにも対応できる。
画像認識技術は、映像の中に何が映っているかを自動的に識別できるようになった。人物の顔、建物、風景、物体、さらには「笑顔」「悲しそうな表情」といった感情まで識別できる。
自然言語処理技術は、テキスト化された内容を意味的に理解し、検索可能にする。たとえば、「子ども インタビュー 商店街 昭和40年代」というキーワードで検索すれば、該当する映像が抽出されるようになった。
つまり、AIは「人間がやっていた作業」を自動化したのである。
2-3. 「昭和40年代の商店街で、子どもがインタビューされている映像」が検索できる時代
これがどれほど革命的か、具体例で考えてみよう。
ある教育番組の制作者が、「昭和40年代の子どもたちの遊びを特集したい」と考えたとする。かつてなら、アーカイブ担当者に相談し、担当者が記憶や目録を頼りに候補をリストアップし、制作者が一本一本視聴して使える映像を探す――という手順が必要だった。
しかし、AIを使えば、「昭和40年代 子ども 遊び」と検索するだけで、該当する映像が一覧表示される。しかも、映像の「どのシーンに子どもが映っているか」まで特定できる。
あるいは、歴史研究者が「1970年代の東京の街並み」を調べたいとする。AIは、映像の中に「東京タワー」「銀座の交差点」「首都高速」などが映っているシーンを自動的に抽出できる。
「昭和40年代の商店街で、子どもがインタビューされている映像」――こんな曖昧な検索が、現実的になったのだ。
2-4. 技術的には、もう解決している
重要なのは、これが「未来の話」ではないということだ。技術的には、もう解決している。
実際、NHKは2020年代に入り、AI技術を使ったアーカイブの自動メタデータ化を試験的に開始している。音声認識による自動字幕生成、画像認識による人物・風景の自動タグ付けなどが実用化されつつある。
他の国でも、BBCやアメリカの議会図書館など、大規模なアーカイブを持つ組織が同様の取り組みを進めている。
つまり、技術的なハードルはほぼクリアされている。では、何が問題なのか?
第3章|最大の壁は「技術」ではない――著作権という現実
3-1. ここで必ず突き当たるのが、権利問題だ
AIで映像を検索できるようになったとしても、それを公開できるかどうかは別問題である。ここで必ず立ちはだかるのが、著作権・肖像権・実演家の権利といった法的問題だ。
NHKの映像には、さまざまな権利が絡んでいる。
- 出演者の肖像権 ― 街頭インタビューに映った一般人、番組に出演したタレント・文化人
- 作曲家・脚本家・俳優の著作権 ― ドラマや音楽番組には、作品の著作権が存在する
- 実演家の権利 ― 歌手や演奏者の実演にも権利が発生する
- 当時は想定されていなかった二次利用 ― 放送当時、インターネットでの公開やAI学習への利用は想定されていなかった
特に厄介なのが、「当時は想定されていなかった利用」である。
3-2. 放送時には存在しなかった「インターネット公開」という問題
1970年代の番組を制作した時、制作者は「この番組がインターネットで全世界に公開される」とは想像していなかった。出演者も、契約書に「インターネット配信の権利」などという項目はなかった。
つまり、当時の契約では、今の利用形態がカバーされていないのだ。
これは、法的にグレーゾーンである。「当時の契約に含まれていないから、勝手に公開してはいけない」という解釈もできるし、「公共放送として保存・活用する権利はある」という解釈もできる。
結果として、NHKは慎重にならざるを得ない。万が一、権利侵害で訴えられた場合、公共放送としての信頼を失うリスクがある。
3-3. AIで検索できるようになっても、公開できるかどうかは別問題
ここに、大きなジレンマがある。
AIで検索できるようになれば、「この映像、教育に使えそう」「この映像、研究に役立つ」という発見が生まれる。しかし、それを公開するには、権利処理が必要になる。
権利処理とは、出演者や著作権者に連絡を取り、許可を得ることだ。しかし、数十年前の番組の出演者を探し出すのは容易ではない。亡くなっている場合もあるし、連絡先が不明な場合もある。
仮に連絡が取れたとしても、許可を得られるとは限らない。「当時の映像を公開されたくない」という人もいるだろう。
結果として、「技術的には可能だが、法的には難しい」という状態が続く。
3-4. 日本特有のジレンマ ― 「誰が責任を取るのか」が決められない
ここで浮かび上がるのが、日本の組織文化の特徴である。
技術はある。需要もある。だが「誰が責任を取るのか」が決められない。
欧米では、こうした問題に対して「合理的なリスク判断」が行われることが多い。たとえば、「一部の権利処理ができなくても、公共の利益が大きいなら公開する」という判断がなされる。もちろん、訴訟リスクはあるが、そのリスクを織り込んだうえで判断する。
しかし、日本では「ゼロリスク思考」が支配的だ。「万が一の訴訟リスク」を恐れて、公開を見送る。結果として、「使えるはずのアーカイブ」が「慎重すぎる運用」によって眠り続ける。
3-5. 著作権法改正の動きはあるが…
実は、こうした問題に対応するため、著作権法の改正議論は進んでいる。たとえば、「アーカイブ機関による公共目的の利用」を認める条項や、「権利者不明の場合の特例措置」などが検討されている。
しかし、法改正には時間がかかる。しかも、法律が変わったとしても、現場が「どこまでやっていいのか」を判断するには、さらに時間がかかる。
結局、法律と技術と現場の運用が、バラバラに進んでいるのである。
第4章|NHKはAIを「作る側」ではないという問題
4-1. NHKはAI開発企業ではない――しかし、動き始めている
NHKはAI開発企業ではない。放送局であり、AI技術を本業とする組織ではない。
しかし、実はNHKは2020年代に入り、独自のAI開発に乗り出している。
2025年5月、NHK放送技術研究所(技研)は、過去約40年分のニュース原稿やニュース記事、番組字幕など約2,000万文を学習させた独自の大規模言語モデル(LLM)を開発したと発表した。これにより、報道された事実に関して誤った回答をする割合を約1割減らすことに成功したという。
また、NHKは2018年から「ニュースのヨミ子」というAIアナウンサーを開発・運用しており、現在では平日午後のニュース、ラジオ、Webニュースなどで実用化されている。
つまり、NHKは外部AIに完全依存するのではなく、自前でもAI開発を進めている。これは重要な動きだ。
4-2. しかし、それでも「海外AIか、国内AIか」の問題は残る
ただし、NHKが独自開発したLLMも、「既存のLLMをベースに追加学習させた」ものである。つまり、基盤となるAI技術自体は、やはり外部に依存している。
現在、高精度なAI技術を提供できるのは、主にアメリカの巨大テック企業である。Google、Microsoft、Amazon、OpenAIなどだ。
これらの企業は、膨大な資金と人材を投じてAIを開発しており、技術力は圧倒的に高い。NHKが「最高のAI」を使おうとすれば、自然とこれらの企業の技術に頼ることになる。
しかし、ここに大きなリスクがある。
4-3. ブラックボックス化のリスク
AI、特にディープラーニングを使ったAIは、ブラックボックスである。つまり、「なぜそういう結果を出したのか」が説明できない。
たとえば、画像認識AIが「この映像には富士山が映っている」と判定したとする。しかし、その判定が正しいかどうかを検証するのは難しい。AIが間違えていても、気づかないかもしれない。
さらに問題なのは、AIのアルゴリズムが公開されていないことだ。企業の機密情報として保護されているため、NHKはAIの中身を完全には検証できない。
これは、公共放送として大きな問題である。「国民の共有財産であるアーカイブを、ブラックボックスのAIで処理する」ことに対して、説明責任を果たせるだろうか?
4-4. データ主権の問題
もう一つの重大な問題が、データ主権である。
NHKアーカイブの映像を、海外のAI企業に処理させる場合、その映像データは企業のサーバーに送られる。そして、AI企業はそのデータを学習データとして利用する可能性がある。
つまり、日本の公共データが、海外企業のAI開発に利用されるという構図が生まれかねない。
これは、国家安全保障の観点からも問題視されている。映像の中には、政治的にセンシティブな内容や、個人情報が含まれているかもしれない。それが、海外のサーバーに蓄積されることは、リスクではないのか?
4-5. 公共データを、誰が、どこまで、どう使うのか
ここで問われるのは、公共データを、誰が、どこまで、どう使うのかという国家レベルの意思決定だ。
- NHKアーカイブは、誰のものなのか?
- AIによる処理は、誰が行うべきなのか?
- データの利用範囲は、どこまで許されるのか?
- 海外企業への依存は、どこまで許容できるのか?
- NHKが独自開発したAIを、民間企業や研究機関にも開放すべきなのか?
これらの問いに対して、明確な答えはまだない。NHKは技術開発を進めているが、社会的合意が追いついていないのである。
実際、2025年11月25日の参議院総務委員会で安野貴博議員が「NHKアーカイブの高品質な日本語データをAI開発に活用すべき」と提案したことに対し、林芳正総務大臣は「研究目的なら放送法に反しない」と前向きな見解を示した。しかし、具体的な制度設計はこれからである。
第5章|話は自治体システムへ――同じ病が広がっている
5-1. この構造は、NHKだけの問題ではない
ここまでNHKアーカイブの話をしてきたが、実はこの構造的問題は、日本の公共セクター全体に共通している。
その典型例が、自治体システムである。
全国の自治体は、住民の生活を支えるために、さまざまなシステムを運用している。
- 住民基本台帳
- 税・福祉・子育て
- 防災・学校・図書館
これらのシステムは、どの自治体でもほぼ同じ機能を持っている。住民の氏名・住所を管理し、税金を計算し、福祉サービスを提供する――基本的な仕組みは同じだ。
5-2. ほぼ同じ機能なのに、自治体ごとに別々のシステムが存在する
ところが、驚くべきことに、自治体ごとに別々のシステムが存在する。
東京都渋谷区のシステムと、大阪府豊中市のシステムは、まったく別物だ。北海道旭川市のシステムと、福岡県久留米市のシステムも、別物だ。
これは、まるで「同じ車を作るのに、メーカーごとに部品の規格が違う」ようなものである。非効率極まりない。
5-3. 結果、開発費は何重にも発生し、仕様変更は高額、ベンダーから逃げられない
この非効率性は、深刻なコスト問題を生んでいる。
まず、開発費が何重にも発生する。同じような機能を、全国1700以上の自治体がそれぞれ発注する。つまり、同じものを1700回作っているようなものだ。
次に、仕様変更が高額になる。法律が変わって、システムを修正する必要が生じたとする。すると、全国の自治体が、それぞれのベンダーに修正を依頼しなければならない。しかも、システムが異なるため、修正費用も自治体ごとに異なる。
さらに、ベンダーロックインの問題がある。一度システムを導入すると、その後の保守・運用は導入したベンダーに依存せざるを得ない。他のベンダーに乗り換えようとすれば、莫大な移行コストがかかる。結果として、自治体は特定のベンダーから逃げられなくなる。
5-4. 「標準化すればいい」は、なぜ実現しないのか
この問題は、ずっと前から指摘されてきた。そして、解決策も明らかだった。標準化である。
全国の自治体が同じ仕様のシステムを使えば、開発費は一回で済む。仕様変更も一回で済む。ベンダーの競争も促進される。
実際、政府は2021年に「自治体システム標準化法」を成立させ、2026年度までに主要なシステムを標準化することを目指している。
しかし、現場の反応は冷ややかだ。「本当に実現できるのか?」「我々の自治体の特殊事情はどうなるのか?」――こうした声が、自治体の担当者から上がっている。
なぜ、明らかに合理的な「標準化」が、なかなか実現しないのか?
第6章|なぜ非効率だと分かっていて、変えられないのか
6-1. ここでも問題は技術ではない
自治体システムの非効率性は、技術的な問題ではない。技術的には、標準化されたシステムを作ることは十分可能だ。
問題は、組織の文化と制度にある。
6-2. 行政は「失敗できない」
行政組織は、「失敗が許されない」文化を持っている。
民間企業なら、新しいシステムを試験導入して、うまくいかなければ元に戻す――ということができる。しかし、行政では難しい。
なぜなら、行政のシステムは「住民の生活に直結する」からだ。住民基本台帳のシステムが止まれば、住民票が発行できなくなる。税のシステムが止まれば、税金の計算ができなくなる。
こうした事態を避けるため、行政は「確実に動くシステム」を優先する。新しい技術や標準化されたシステムは、「リスク」と見なされる。
6-3. 担当者は数年で異動
さらに、行政の人事制度も問題を複雑にしている。
自治体の職員は、数年ごとに部署を異動する。つまり、システムの担当者が、数年で入れ替わるのである。
これは、長期的なシステム改革を難しくする。改革を始めても、担当者が異動すれば、その知見は失われる。次の担当者は、また一から学ばなければならない。
結果として、「現状維持」が最も安全な選択肢になる。
6-4. トラブル時の責任が怖い
もう一つの大きな要因が、責任問題である。
新しいシステムを導入して、もしトラブルが起きたら、誰が責任を取るのか?担当者個人が責任を問われるのか?それとも、組織として責任を取るのか?
この点が曖昧なまま、担当者は「トラブルが起きないこと」を最優先に考える。結果として、「新しいことをやらない」という選択になる。
6-5. 前例がないことはやらない
そして、日本の行政文化を象徴する言葉が、「前例がない」である。
標準化されたシステムを導入するのは、多くの自治体にとって「前例がない」ことだ。前例がないことは、リスクが読めない。リスクが読めないことは、避けるべきだ――こうした思考が支配的になる。
6-6. つまり、合理的な判断ができない構造なのだ
これは、担当者個人の怠慢ではない。制度設計の問題である。
- 失敗が許されない文化
- 短期間での人事異動
- 個人に責任が押し付けられるリスク
- 前例主義
これらが組み合わさって、合理的な判断ができない構造が生まれている。
6-7. 【2026年2月追記】標準化は本当に進んでいるのか?
実は、この記事を書いている2026年2月現在、自治体システム標準化は深刻な遅延に直面している。
政府は2021年に「自治体システム標準化法」を成立させ、2026年3月末までに全国の自治体が標準準拠システムに移行することを目標としていた。しかし、2025年10月末時点で、標準化対象となる全34,592システムのうち、14.5%(5,009システム)が期限内の移行が困難とされている。
団体数では、1,788団体のうち41.6%(743団体)が「特定移行支援システム」を抱えている。つまり、全自治体の4割以上が、期限に間に合わないのである。
遅延の理由は何か?
- 現行システムがメインフレームで運用されており、移行に時間がかかる
- 現行システムが個別開発されており、標準仕様への適合が困難
- ベンダーのリソースが逼迫し、開発・移行作業が遅延している
- 富士通やRKKCS(リコー・日本事務器グループ)など大手ベンダーが、担当システムの期限内移行が困難と宣言
つまり、理念は正しかったが、現実の実行が追いつかなかったのである。これは、まさに本記事で指摘してきた「決めることはできても、やり遂げる体制がない」という日本の構造的問題の縮図だ。
第7章|オープンソースは万能薬ではない
7-1. オープンソースは魔法の言葉ではない
自治体システムの標準化と並んで、よく語られるのがオープンソースである。
オープンソースとは、ソフトウェアのソースコードを公開し、誰でも自由に利用・改変・再配布できるようにする仕組みだ。
オープンソースには、多くのメリットがある。
- 共通化 ― 一度開発すれば、全国の自治体が使える
- 再利用 ― 他の自治体が改良したものを、自分の自治体でも使える
- コスト削減 ― ライセンス費用がかからない
- 透明性 ― ソースコードが公開されているので、セキュリティや不具合を検証できる
理屈は正しい。しかし、理屈だけでは動かない。
7-2. 運用には人と組織が必要だ
オープンソースのシステムを導入したとして、それを「運用」するのは誰か?
- システムの更新は誰が行うのか?
- トラブルが起きたら、誰が対応するのか?
- 新しい機能を追加したいとき、誰が開発するのか?
こうした運用には、人と組織が必要だ。
民間企業なら、ベンダーがこれらを担当する。しかし、オープンソースの場合、ベンダーに依存しないことがメリットでもあるが、自治体が自前で運用する負担が増えるというデメリットもある。
7-3. 「技術を導入すれば解決」ではない
ここで重要なのは、技術を導入すれば解決、ではないということだ。
オープンソースは、あくまで「道具」である。道具を使いこなすには、それを扱う人と、組織の体制と、継続的なメンテナンスが必要だ。
しかし、日本の自治体の多くは、IT人材が不足している。しかも、前述のように数年で異動してしまう。こうした状況で、オープンソースを使いこなすのは容易ではない。
7-4. 運用できる覚悟があるかが問われる
オープンソースの導入を成功させた事例は、国内外に存在する。しかし、それらに共通しているのは、運用できる覚悟と体制を整えたという点だ。
たとえば、エストニアは電子政府で有名だが、その背景には国家レベルでのIT人材育成と、継続的な投資がある。
日本でも、一部の自治体がオープンソースの導入に成功している。しかし、それは「先進的な自治体だからできた」という側面が強く、全国に広がるには至っていない。
第8章|それでも、公共データは統合できる
8-1. 絶望的な話ばかりではない
ここまで、かなり悲観的な話をしてきた。しかし、絶望的な話ばかりではない。
NHKアーカイブ、自治体の歴史資料、図書館・学校・博物館――これらが共通基盤でつながったらどうなるか。想像してみてほしい。
8-2. 教育で使える
たとえば、小学校の社会科の授業で、「自分の町の歴史」を学ぶとする。
教師が、NHKアーカイブから地元の昭和時代の映像を検索し、自治体の歴史資料館から当時の写真を取り出し、図書館の郷土史資料を参照する――これがすべて、同じプラットフォームでできたらどうだろう。
子どもたちは、教科書の文字だけでなく、実際の映像や写真を通して、自分の町の歴史を体感できる。
8-3. 研究で使える
歴史学者や社会学者にとって、統合された公共データは宝の山だ。
たとえば、「戦後の地方都市の人口動態と産業構造の変化」を研究したいとする。自治体の統計データ、当時の映像、新聞記事、議会議事録――これらが横断的に検索できれば、研究は飛躍的に進む。
しかも、AIを使えば、膨大なデータの中から関連する情報を自動的に抽出できる。
8-4. 地域振興に使える
観光や地域振興にも活用できる。
たとえば、地方の観光協会が、「昭和のレトロな街並み」を売りにしたいとする。NHKアーカイブから当時の映像を見つけ、自治体の資料館から古い写真を取り出し、それらを観光パンフレットやウェブサイトに活用する――こうしたことが、簡単にできるようになる。
8-5. これは夢物語ではない
重要なのは、これが「夢物語」ではないということだ。
技術的には可能だ。実際に成功している国は存在する。
たとえば、ヨーロッパのEuropeana(ユーロピアーナ)は、EU加盟国の図書館・博物館・アーカイブのデジタルコンテンツを統合したプラットフォームだ。誰でも無料でアクセスでき、教育・研究・文化活動に活用されている。
アメリカの国立公文書館(NARA)も、膨大なデジタルアーカイブを公開しており、AI技術を活用した検索機能を提供している。
日本にも、技術はある。データもある。人材もいる。
足りないのは、やると決める意志だけなのだ。
第9章|日本に足りないのは「技術」ではない
9-1. データはある
NHKアーカイブ、自治体の記録、図書館の蔵書、博物館の資料――日本には、質の高い公共データが膨大に存在する。
9-2. 技術もある
AI技術、データベース技術、ネットワーク技術――すべて、日本は高い水準にある。国内のIT企業も、大学の研究機関も、十分な技術力を持っている。
9-3. 人材もいる
優秀なエンジニア、研究者、プロジェクトマネージャー――人材も不足していない。
9-4. 足りないのは――「使うと決める意志」である
では、何が足りないのか。
使うと決める意志である。
技術はある。しかし、「誰が責任を取るのか」が決まらない。 データはある。しかし、「どこまで公開していいのか」が決まらない。 人材はいる。しかし、「継続的に投資するのか」が決まらない。
結果として、すべてが宙に浮いたまま、前に進まない。
9-5. NHKアーカイブも、自治体システムも、本質的には同じ問いを突きつけている
NHKアーカイブも、自治体システムも、本質的には同じ問いを突きつけている。
日本は、自らの知をどう扱う国なのか?
公共データを、国民の共有財産として活用するのか。それとも、リスクを恐れて眠らせ続けるのか。
前例がないから動けないのか。それとも、前例を作る覚悟を持つのか。
これは、技術の問題ではない。社会の問題であり、政治の問題であり、文化の問題なのだ。
第10章|個人の賢さで終わらせないために――安野貴博氏というケース
10-1. 2025年、国会に現れた「AIエンジニア出身の政治家」
2025年7月、参議院議員選挙で当選した安野貴博氏(チームみらい党首)は、AIエンジニア・起業家という経歴を持つ異色の政治家だ。
彼は当選後、参議院総務委員会で初質問を行い、NHKアーカイブのAI活用、自治体システムのオープンソース化、プッシュ型行政サービスの実現などを提案した。その答弁スタイルは明快で、論点整理が速く、データと技術的知見に基づいた具体的な提言を行う。「AIを使いこなしている政治家」として注目を集めるのも自然だろう。
実際、2025年11月25日と12月2日の総務委員会での質疑では、彼は以下のような具体的な提案を行っている。
- NHKアーカイブの高品質な日本語データをAI開発に活用すること
- 公費で開発したソフトウェアをオープンソース化し、自治体間で共有すること
- 申請主義から脱却し、データに基づいたプッシュ型の行政サービスを実現すること
これまでの政治家とは、明らかに異なるスタイルだ。
10-2. しかし、ここで立ち止まる必要がある
しかし、ここで立ち止まる必要がある。
重要なのは、安野氏が優秀かどうかではない。問題は、
安野氏がいなくても、この仕組みは回るのか?
という一点だ。
10-3. 日本には、過去にも「個人の天才」に依存した技術構想があった
日本には、過去にも「個人の天才」に依存した技術構想があった。代表例がTRON(トロン)である。
TRONは、1980年代に東京大学の坂村健教授が提唱した、組み込みシステム向けのOSである。技術的には世界最高水準だったが、制度・政治・国際調整の壁を越えられず、広範な社会実装には至らなかった(ただし、組み込みシステムとしては世界的に成功を収めた)。
TRONの経験が教えるのは、技術の優秀さだけでは不十分だということだ。問題は、それを社会に根付かせる仕組みと体制を構築できるかどうかだ。
10-4. 安野氏の事例が示しているのは、「AI的思考が政治の場に侵入し始めた」という事実
安野氏の事例が示しているのは、「AI的思考とテクノロジーの知見を持つ人材が政治の場に現れ始めた」という事実であって、個人依存の改革が自動的に成功する保証ではない。
もし、
- NHKアーカイブのAI活用が
- 自治体システムの共通化が
- オープンソース化の推進が
特定の人物の力量や在任期間に依存するなら、それは長続きしない。その人物が異動したり、落選したり、病気になったりすれば、すべてが止まる。
10-5. 必要なのは、再現可能な制度
必要なのは、
- 再現可能な制度 ― 誰が担当しても、同じように動く仕組み
- 標準化された仕組み ― 属人性を排除した、誰でも使える仕組み
- 個人が抜けても壊れない運用 ― 組織として継続できる体制
安野氏が提案した内容は、いずれも正しい方向性を示している。しかし、それが法制度として整備され、予算が継続的に確保され、組織的な運用体制が構築されなければ、一時的な「話題」で終わってしまう。
10-6. 安野氏は「答え」ではない。「兆候」であり、「入口」である
安野氏は「答え」ではない。兆候であり、入口である。
彼の存在は、「日本の政治にも、テクノロジーとデータに基づいた政策立案ができる人材が現れ始めた」という希望を示している。しかし、それが「個人の力量」だけで終わってしまえば、また同じ失敗を繰り返す。
重要なのは、安野氏のような人材が継続的に政治の場に参入できる土壌を作り、彼らが提案した仕組みが個人に依存せず組織として回る体制を整えることだ。
そして何より、彼が提案した「NHKアーカイブのAI活用」や「自治体システムのオープンソース化」が、具体的な法改正と予算措置を伴って実現されるかどうかが、真の試金石となる。
おわりに:宝の山を、宝のまま眠らせる国でいいのか
日本には、世界でも屈指の「公共データの宝庫」がある
NHKアーカイブ、自治体の記録、図書館の蔵書、博物館の資料――日本には、世界でも屈指の「公共データの宝庫」がある。
それは、単なるデータの集積ではない。戦後から現在までの、日本社会の記憶そのものだ。
それを、怖いから、面倒だから、前例がないから――という理由で眠らせ続けるのか
それを、怖いから、面倒だから、前例がないから――という理由で眠らせ続けるのか。
それとも、失敗を前提に、段階的に、社会全体で使い倒すのか。
失敗を恐れるあまり、何もしないことが最大の失敗である
失敗を恐れるあまり、何もしないことが最大の失敗である。
データは、使われなければ意味がない。技術は、社会に実装されなければ価値がない。人材は、活躍の場がなければ埋もれてしまう。
NHKアーカイブのAI活用も、自治体システム改革も、単なる技術論ではない
NHKアーカイブのAI活用も、自治体システム改革も、単なる技術論ではない。
これは――日本が、自らの知をどう扱う国なのかという問いそのものなのだ。
宝の山は、すでにそこにある
宝の山は、すでにそこにある。
あとは、それを掘り出す覚悟を持つだけだ。
技術はある。データもある。人材もいる。
足りないのは、使うと決める意志だけなのである。
【付記】この記事について
本記事は、日本の公共データ活用における構造的問題を、NHKアーカイブと自治体システムという2つの事例を通して考察したものです。技術論ではなく、社会構造・組織文化・政治的意思決定の問題として捉えることを試みました。
2026年2月時点での最新情報
- NHK放送技術研究所が約40年分・2,000万文のニュースデータを学習させた独自LLMを開発(2025年5月発表)
- 自治体システム標準化は深刻な遅延に直面。全体の14.5%が2026年3月期限に間に合わず
- 安野貴博参議院議員(チームみらい党首)が国会でNHKアーカイブのAI活用を提案(2025年11月・12月)
個別の事例については、今後の展開によって状況が変わる可能性があります。しかし、「宝の山を活かせない構造」という本質的な問題は、今も続いています。
この記事が、公共データのあり方を考えるきっかけになれば幸いです。
【主要参考資料】
- NHKアーカイブス 公式サイト (https://www.nhk.or.jp/archives/)
- NHK放送技術研究所「技研公開2025」資料
- デジタル庁「地方公共団体の基幹業務システムの統一・標準化」(https://www.digital.go.jp/policies/local_governments)
- 総務省「自治体情報システムの標準化・共通化」関連資料
- 参議院総務委員会 議事録(2025年11月25日、12月2日)
- Europeana(ユーロピアーナ)公式サイト (https://www.europeana.eu/)
- アメリカ国立公文書館(NARA)デジタルアーカイブ (https://www.archives.gov/)
- ダイヤモンド・オンライン「自治体ITシステム標準化の大遅延」特集記事(2024年10月、2025年11月)
- 日経クロステック「自治体システム標準化」関連記事
【関連キーワード】
NHKアーカイブ AI活用 / 自治体システム標準化 / デジタル敗戦 / 公共データ活用 / ベンダーロックイン / ガバメントクラウド / オープンソース OSS / 行政DX / データ主権 / 著作権問題 / 安野貴博 / チームみらい / デジタル民主主義 / 前例主義 / 日本のIT後進国問題 / 公共インフラ / アーカイブ検索 / AI音声認識 / 画像認識 / 自然言語処理 / システム移行 / TRON / 坂村健 / 標準準拠システム / 特定移行支援システム / 富士通 / RKKCS / デジタル庁 / 総務省