ビッグデータの5つの「V」
NIでは、Big Analog Data™というエンドツーエンドソリューションに積極的に取り組んでおります。まず、一般的なビッグデータについて考察しましょう。ビッグデータは、次の4つの「V」を組み合わせて定義されることが多いです。
Volume (容量) | システムが大量、または大容量のデータを収集する |
Variety (多様性) | システムによって収集/解析されるデータは、構造や形式が多岐にわたる |
Velocity (速度) | データは高いサンプルレートで高速で収集される |
Value (価値) | かつては技術的に限界があったデータ解析から膨大な価値が得られるようになった |
そして、もう一つの「V」は、「Visibility (可視性)」です。これは、お客様と共に仕事することを通じて、NIが発見したものです。 これは、世界中に散らばっている企業が、解析を行い、結果を確認するために、複数の場所にあるデータにアクセスする必要があることを意味しています。
Visibility (可視性) | データは、地理的に分散した複数の場所からアクセス、または閲覧される |
ビッグデータは、上記の5つすべての特性を備えている必要はなく、5つの中のいくつかの特性を併せ持つだけで、ビッグデータであると見なすことができます。
ビッグデータの起源はどこでしょうか?
ビッグデータの起源はさまざまです。データソースは、主に以下の3つのカテゴリに分類することができます。
産業分野/IT分野のデータソース | 古くからビッグデータに関わるソースです。例としては、ERM/CRM/HRといったエンタープライズアプリケーションからのデータや、イベント/ログ/インベントリといったITデータがあります。 |
ソーシャルソース | ビッグデータの新たなソースです。たくさんのソーシャルコンテンツを日々作る人が、増えています。ユーザが製品や企業に関する自らの体験や事例をオンラインで率直に幅広い層に向けて公開する中、ベンダーは、こうしたデータを活用し、納得のいくものにしようとしています。 |
技術的/科学的データソース | エンジニアや研究者は、物理的な世界で生じるアナログ的な現象からデータを収集します。これこそがBig Analog Data™情報のソースです。つまり、物理的なアナログ世界を測定し、アナログ-デジタル変換 (A/D) によりデジタル化して得られるビッグデータということです。 |
Big Analog Data™のソースははっきりとしたものであり (光、RF信号、振動、温度など)、世の中で自然発生したり、機械や電子機器などの機械からも発生します。Big Analog Data™は、一般的なビッグデータと比較すると、以下の3点が異なります。1)より古い: 科学者らは、アナログデータは宇宙の起源から存在していると考えている 2)より高速: 収集に使用するNIの製品を見ても、そのサンプルレートやデジタル化のレートは非常に高速である 3) より大きい: アナログデータのソースはいたるところに存在し、絶えずデータを生成している
Big Analog Data™ソリューションの3層アーキテクチャ NIは、Big Analog Data™ソリューションを、3層から成るソリューションアーキテクチャで表しています。つまり、このソリューションは、独立した3層にあてはまる要素によって構成されます。これらを組み合わせることで、統合された単一のソリューションが構築されます。このソリューションは、データが (センサから) 最初に収集される時点から、最終的にそのデータに基づく意思決定が行われるところまで網羅します。
|
第1層 データに基づく意思決定を行うための最初のステップは、データを正確に収集することです。温度、歪み、圧力といったアナログデータは、自然現象の収集処理によって得られます。アナログデータのソースは非常に多岐にわたるので、各システムには、測定する自然現象の種類や規模に見合った固有のセンサやアクチュエータ (制御用途で使用する場合) が必要となります。 | 第2層 エンドツーエンドのビッグデータソリューションにおいて、この第2層は非常に重要な意味を持ちます。こうしたシステム (CompactRIO、PXI、NI CompactDAQ) は、通常、データがリアルタイム、または初期段階にある際、センサから得られるデータが精確であるというメリットと、データ解析が詳細であるというメリットとを結びつけるのに有効だからです。システムノードは、ネットワークに接続されたハードウェア (ならびに関連するソフトウェア) です。これは、収集されたデータのA/D変換、調整、および初期解析を行い、「エッジ」をまたいでスイッチ、サーバへとデータを送信しやすくします。サーバではデータが保存され、通常はさらに詳細な解析が行われます。 NIハードウェア:CompactRIO、PXI、NI CompactDAQ NIソフトウェア:NI LabVIEW、NI VeriStand、NI TestStand | 第3層 第2層を経て「エッジ」をまたいだデータはネットワークスイッチを経由してサーバに引き渡されます。サーバではデータを保存し、さらに詳しい解析を実行することができます。収集したデータの多大な価値をお客様が実感できるのは、この時点です。多くの技術的、科学的、およびビジネス上の意思決定が行われるのもこの段階です。この層には、NIのお客様にとって成長著しい魅力的なITインフラであるクラウドも含まれています。また、ITインフラ内では、NIのシステム管理ソフトウェアやRASMソフトウェアの多くが稼働し、NIのシステムノード製品 (CompactRIO、PXI、NI CompactDAQ) に影響します。これについては、以下で詳しく説明します。 NIソフトウェア:NI DIAdem、NI DataFinder |
Big Analog Data™ソリューションの構築時の3つのイノベーション領域、および主要な検討事項
1.データの管理と転送 | データの価値を実感できるのは、収集時よりも後の方が多いです。そのため、他のシステムにデータを正確かつ安全に転送できることが、欠かせません。データはフォーマッティングして保存し、簡単に分類できる状態にして、重要な特徴が目立つようにしておく必要があります。エンジニアは、複数のソースからの大量の点在データにすばやくアクセス可能とする、管理、視覚化、並びにレポート作成用の信頼性の高いツールを求めています。 テストやシミュレーション中に生成された大量のデータをSystemLink TDM DataFinderモジュールで処理することの詳細を見る |
2.データ解析 | データの解析と視覚化は、データから洞察を得るための鍵になるものです。収集したデータの価値は、初期解析を行った後だけでなく、その解析結果をさらに解析した後でも見出されることがよくあります。ビジネスに役立つ結論を容易に導き出すことができないのに、膨大な量のデータがあっても意味はありません。そのような時、とかく役立つのが、「データマイニング」と呼ばれる手法です。 |
3.システム管理/RASM | ネットワーク全体にわたり使用/管理される複数の分散システムノードが必要になる用途が、多々あります。こうした分散システムを確実に期待どおりに動作させるには、ソフトウェアの構成、デプロイ、状態監視、インベントリ、必要に応じてサービスを更新しなければなりません。
|
留意すべき点として、これらのシステム管理/RASMツールの価値は、管理対象のソリューション内のシステムノード (CompactRIO、PXI、NI CompactDAQ) の数に正比例することが多いということです。RASMに関するNIの主導的な取り組みに関する詳細については、ni.com/rasmを参照してください。
上記3つの各分野において、NIはBig Analog Data™ソリューションの使いやすさとメリットを高めるべく、イノベーションに向けた投資を行っています。LabVIEWやDIAdemなどのソフトウェアは、センサでデータが収集された時点から、収集用ハードウェアにおける初期の処理を経て、サーバ上にアーカイブされるまで、非常に重要な役割を担います。