こんにちは。SCSKでNebulaShift diを担当している西廣です。
今回は今年(2026/1月)に発表された「Databricks Boxデータ連携ソリューション Powered by Macnica」について、お届けしたいと思います。
言わずと知れたBoxですが、単なるクラウドストレージではなく、セキュリティやワークフロー、Gen AIなど従来のファイルサーバの域を超えて幅広く利用されています。国内では22,000社以上の企業が利用しており、弊社含めて社内で活用している方も多いのではないでしょうか。
ファイルサーバ代わりに使われているBoxなので、データソース(取込元のシステム)がBoxというのはあるあるなので、Databricksから簡単に取り込めるようになったのは非常に大きいです。
https://www.macnica.co.jp/business/dx/manufacturers/databricks/architecture-box-integration.html
機能としては、Box上に保存されているファイルをAPI経由でDatabricksへ取込み、Databricks上で利用できるようになるというシンプルなものですが、様々なユースケースがあります。
これまでもBox自体はAPIを保有していたので、開発を前提としますが、技術的には連携可能でした。ただ、Boxの仕組みやAPI仕様を理解してDatabricks側でデータパイプラインを実装する必要があり、ハードルが高かったのも事実です(PythonならRequestsベースで実装)。
* Box APIリファレンス https://ja.developer.box.com/reference/
データソースのバージョンアップなど仕様変更に伴う改修もデータ連携だと必要ですが、今回のアダプタ機能はbox仕様変更もサポートされるので、その点も安心です。
BOXのエコシステムソリューションに登録されているため、通常は課金対象となるBoxのAPIコール費用が非課金となります。この手のシステム連携ではトランザクション量の見通しが立てにくく、従量課金の場合、年度ごとの予算計画/管理が煩雑になりがちです。その点においても本連携は大きなメリットがあり、助かります。
さて、実際にはどのようなユースケースがあるでしょうか。
生成AI活用を考えると、Box AIを活用するパターンと、データ統合基盤側のLLMモデルにデータを連携するパターンが考えられます*1。
アイディア次第ですが、私の想定するユースケース3つについて紹介します。
① 【構造化データ】Boxを介して散在するデータを集計&可視化分析
業務の現場では予実管理などをはじめとして、Excelなどのファイルへ入力されたデータを統括部門側で手動集計しているケースなどが良くあります。データの格納先としてBoxを利用することで、Databricksによる集計とBIダッシュボートでの可視化まで完結されることが可能です。
② 【構造化データ+非構造化データ】統合ダッシュボートによるデータ一元化
建設業の施工管理など、進捗管理などの表データと施工写真などの画像データなど、異なる保存場所やフォーマットのデータを統合したいというケースがあります。Boxからデータ基盤側へ連携することにより、一元的にデータへアクセス出来ます。例えばBIダッシュボートでも、Boxリンクを埋め込むことで画像やPDFなどの元ファイルへ簡単にアクセス可能です。
③ 【構造化データ+非構造化データ】生成AI活用
「②統合ダッシュボートによるデータ一元化」を更にもう一歩進めて、生成AIに対してデータ連携していくことで、データの分析・解釈・タスクの自動化などを実現できます。データ基盤上でファイルを転送し、データ加工からRAG(ベクトルDB化)を構築することで、在庫システムの情報とExcelの販売計画の情報を統合してデータ横断で生成AIが分析します。
今後普及してくるマルチモーダルなAIでは、従来のRAGデータに加えて構造化データを組合せた活用が必要になってきます。また、Agentic AIの活用には業務データのスムーズな連携が不可欠です。
過去blogのブログ記事*2に掲載のように、Databricksからは様々な最新LLMモデルが活用可能ですので、データ基盤を起点にその時点のベストモデルへルーティングしていく方式も取れます。
まさにNebulaShift diが目指すデータ統合のあるべき姿です。
今回のblogでは、Box―Databricks連携についてご紹介しました。国内で多くのユーザーが利用するBOXからデータ基盤へ簡単に連携できる仕組みは、これから到来するAIエージェント時代に向けて大きな一歩だと思います。
最後に宣伝ですが、NebulaShift diのチームには両製品のエンジニアも在籍していますので、本記事の内容にご興味ありましたらぜひお問合せください。
最後までご覧いただきありがとうございました。
*1 Databricks活用術 #1】インフラ管理ゼロ!
Mosaic AI Model ServingとDatabricks Appsで最新LLMを利用したAIチャットボットを5分で作って公開する。
*2 今後MCPによるTools活用やA2A(Agent-to-Agent)通信が一般化してくると、Boxとその他Agentのマルチエージェント構成のようなアーキテクチャも出てくるかもしれません
記載されている製品/サービス名称、社名、ロゴマークなどは該当する各社の商標または登録商標です。
本ブログ記事は正確性を保証するものではなく、記事の内容によって生じた結果について、いかなる責任も負いません。