タグ別アーカイブ: PowerPivot

Excel PowerQuery/PowerPivotを利用する場合の推奨するタスクフロー

PowerQuery/PowerPivotは機能が多いため、いくつかの側面では機能重複を起こしている面がある。たとえば、PowerPivot単体でもデータのインポートが行える。また、PowerQueryもTable.Pivotを使って集計することが出来る。従って、一つのタスクを実行するにしても複数のフローが考えられる。しかし、現実的な分析を行うにはある程度、推奨できるタスクフローが定義できる。本稿では以下のタスクフローを推奨する。このフローはExcel 2013以降でPowerQuery、PowerPivotを使う場合を想定している。

  • Power Queryでデータを取得する
  • 分析に必要な加工をPower Queryで行う
  • Power Pivotにデータモデルを出力する
  • Power Pivotで集計を行い可視化する
  • このタスクフローではPower QueryをETLツールとして活用し、加工されたデータをPower Pivotで集計し可視化するというフレームワークをとっている。Power Pivotは内部的に列指向のデータベースを持っているため集計に適するが、一方でデータ加工を行うには式で定義できる制約があるためPower Queryには機能性・生産性で及ばない。従って、Power Pivotで集計のパフォーマンスを稼ぎ、データ加工はPower Queryで柔軟にというのがもっとも現実的と思われる。

    そのため、ETLツールとしてはPower Queryを活用する。また、本稿ではアドホックな分析を前提とするが、集計をある程度規格化する場合には、SQL Server Analytics Services (SSAS)で集計の仕方を配布することも検討してほしい。