【３分で流し読み】SQL Serverのビッグデータクラスターでできることを理解する【廃止が決まってるけど】

こんばんは。今日は、SQL Serverのビッグデータクラスターについて少し調べてみたので、学んだことなどをまとめておきたいと思います。

これ、SQL Server 2019で登場した新しい機能にもかかわらず2025年2月28日に廃止されることが決まっているようで、これから使うことはないと思われますが、登場や廃止の経緯を理解する目的で調べてみました。

それではまいります。

ビッグデータクラスターとは

ビッグデータクラスターの概要 – SQL Server Big Data Clusters | Microsoft Docs

SQL Server 2019で登場したSQL Server用のアドオン
Kubernetes 上で構成された SQL Server、Spark、 HDFS コンテナーのクラスター（いずれもLinuxコンテナ）
クラスター内のコンポーネントに読み込み・書き込み・処理を並行して実行できるので、RDBMSのデータとビッグデータを簡単に組み合わせて分析できる
PolyBaseを利用したデータの仮想化にも対応しているので、SQL Server外部のOracle、Teradata、MongoDB などのデータソースのデータも照会することもできる
上のアーキテクチャ図にある各コンポーネントがKubernetes上に構成される
利用するには、Kubernetesを構成した上で、「azdata bdc create」コマンドで展開する
2025年2月28日に廃止予定

利用シナリオ例は以下。

１，PolyBaseを利用したデータの仮想化

２，データレイク（HDFS）のデータをSparkやSQL Serverで分析

３，機械学習

ビッグデータクラスター廃止

さて、この機能は廃止されるようなので、動作の詳細を追いかけるよりは、廃止に伴う移行方法を理解しておきたいと思います。

こちらにまとまっています。

Microsoft SQL Server プラットフォームのビッグデータオプション – SQL Server | Microsoft Docs

いくつかのオプションが紹介されていますが、要はAzure上のサービスの組み合わせでおきかえてね、ということのようですね。この記事を見ていると、この機能を早々に廃止したMicrosoftの意図も見えてきそうです。ビッグデータクラスター機能を使ってがんばって高度なクラスターを１から作りあげるよりも、クラウドを活用してより簡単に実現していこう、ということなのですかね。

Azure Synapse Analytics
Azure SQL Database + Azure Machine Learning
Azure SQL Database + Azure Databricks
SQL Server 2022（Synapse Link for SQLを利用） + Azure Synapse Analytics
オンプレでがんばって構成（SQL Server + Apache Spark + オンプレストレージ）

以上、簡単ですが、SQL Serverのビッグデータクラスターの超概要でした。

少しでも参考になりましたら幸いです。

おしまい

【３分で流し読み】SQL Serverのビッグデータクラスターでできることを理解する【廃止が決まってるけど】

ビッグデータクラスターとは

ビッグデータクラスター廃止

関連

コメントを残す

Profile

Categories

yutaro013_scenery

Trending Posts

【2023年度最新版】Azure Administrator Associate資格 (AZ-104)を3日で取得した話。勉強方法は？取ってよかった？

【詳解】クライアント証明書認証を実装しながら理解する – 前編：概要～証明書作成編

【VSCodeで開発】コミットしようとしたら「Git の ‘user.name’ と ‘user.email’ を構成していることを確認してください」エラーが発生する

【自然言語処理】PythonとTwitter APIでデータ分析

【2023年最新版】Microsoft Cybersecurity Architect Expert資格 (SC-100)を1週間で取得した話。勉強方法は？取ってよかった？

【2023年最新版】Azure Solution Architect Expert資格 (AZ-305)を1週間で取得した話。勉強方法は？取ってよかった？

超便利＆簡単！VS Codeの設定を複数PC間で同期する

【機械学習】Scikit-Learnで交差検証(Cross-Validation)を一瞬で実装する【Python】

AzureのSAS（共有アクセス署名）を分かりやすく解説する

Azure Developer Associate資格(AZ-204)を10日間で取得した話。勉強方法は？取ってよかった？

Microsoft Power Platform Fundamental資格 (PL-900)を取得した話。勉強方法は？取ってよかった？

【Python×自然言語処理】テキストデータを極性辞書で感情分析してみる

【2023年最新版】Azureの認定資格を1ヶ月で全部とる。資格一覧と対策方法・体験記まとめ

Azure Data Fundamentals資格 (DP-900)を2日で取得した話。勉強方法は？取ってよかった？

CPU使用率とCPU時間について分かりやすく解説する

【データ分析】MacOSで複数のPython/Anacondaバージョンを使い分ける方法【pyenv】

【機械学習】決定木モデルの変数重要度をわかりやすく解説する

機械学習における転移学習とファインチューニング

勾配ブースティングのDART法について調べてみた

Azure AI Fundamentals (AI-900)を2日で取得した話。勉強方法は？取ってよかった？

アーカイブ