インフォ・ラウンジ、AI時代に対応した次世代データカタログ基盤「KUKAN」をオープンソースで公開

インフォ・ラウンジ株式会社は、ファイルの中身まで対象とした全文検索や生成AIからの直接の問い合わせに対応する、オープンソースのデータカタログ基盤「KUKAN」を公開いたしました。

概要

KUKANは、自治体等の公共機関や研究機関が組織で管理するデータを公開・共有するための基盤ソフトウェアです。世界各国の政府・公共機関で広く利用されてきたデータカタログシステム「CKAN」のモダンな後継として、保守性・拡張性・検索性を重視して設計されました。オープンソース公開を通じて、組織のデータ利活用と運用負荷の軽減を支援します。
提供元:インフォ・ラウンジ株式会社(運営:インフォ・ラウンジ株式会社)
主な特徴:ファイル名やタイトルだけでなく、PDF・Excel等の中身まで横断検索、CSV/TSVをParquet形式へ自動変換しブラウザ上での高速なテーブル表示・データ分析を実現、多様なプレビューフォーマット(全20種類以上)、CKAN互換API対応、MCPサーバー搭載でAIからの直接問い合わせ対応
ライセンス:AGPL-3.0およびプロプライエタリ(商用)ライセンスのデュアルライセンス

AI時代を見据えた次世代データカタログ基盤

インフォ・ラウンジ株式会社は、15年以上にわたるCKANを用いたオープンデータカタログ構築・運用の実務経験から、保守の負担、スケーラビリティの制約、運用負荷の高さといった課題を解決するため、KUKANを開発しました。KUKANは、モダンなアーキテクチャによりアクセス集中にも耐えうるスケーラビリティを確保し、壊れにくい設計でカスタマイズやバージョンアップに伴う改修リスクを低減します。また、日々のデータ管理の手間を抑え、本来業務であるデータの品質向上やデータ利活用の推進に注力できる環境を目指しています。

KUKANの技術的・運用的な優位性

KUKANはオープンソースソフトウェア(OSS)としてGitHub上で公開されており、ソースコードは誰でも利用可能です。これにより、自治体や事業者は自らの環境に合わせて導入・拡張でき、特定の事業者に依存しない持続的な運用が可能となります。主な技術的特徴としては、ファイルの中身まで横断検索できる機能や、CSV/TSVをデータ分析に最適化されたParquet形式へ自動変換し、ブラウザ上での高速なテーブル表示・データ分析を実現する点が挙げられます。さらに、多様なプレビューフォーマットやCKAN互換API、デプロイ用テンプレートも標準搭載されています。AI時代への対応として、MCPサーバーを標準搭載し、ChatGPTやClaude等のAIから直接データを問い合わせることが可能です。

今後の展望とライセンス

KUKANはAGPL-3.0およびプロプライエタリ(商用)ライセンスのデュアルライセンスを採用しており、オープンソースとしての自由な活用と、商用利用などニーズに応じた柔軟な提供体制を実現しています。インフォ・ラウンジ株式会社は、今後も機能の拡充とドキュメントの整備を継続的に進め、自治体DX、オープンデータの利活用、データ品質の向上、そして持続可能な公共データ基盤の実現を支援していく方針です。導入に関する相談や、機能に関する要望、不具合報告などは、問い合わせ先まで連絡を受け付けています。

まとめ

オープンソースのデータカタログ基盤「KUKAN」は、AI時代に求められる高度な検索機能とAI連携を可能にし、組織のデータ利活用を促進します。保守性・拡張性・検索性を高め、運用負荷を軽減することで、データ本来の価値創出に集中できる環境を提供します。

関連リンク

https://kukan.dev/
https://github.com/kukan-project/kukan
https://info-lounge.jp/

関連記事