Power BIにはPower BI desktop/Power BI サービス/Power Queryなど複数のツールがあるので、データ分析・データ利活用に不慣れな方からは、いつどのツールを使えばよいのかわからない!結局どれを使えばいいの?と思うかと思います。
今回の記事は、これからPower BIを使う方、これからデータ分析・データ利活用を実施される方向けに、Power BIを使ったデータ分析の流れを架空の業務を想定して説明します。
この記事を読むことで、以下のことを知ることができます。
・業務でよくあるデータ分析業務の流れ
・業務で使うことになる最低限のPower BI の操作方法
初めてPower BI Desktopを使われる方は、以下のチュートリアルを実施してから、本記事を読むことでPower BI Desktopの基本操作を学べます。
また、本記事は以下のチュートリアルを読まなくてもデータ分析業務の流れを学べるように準備しました。
【初心者向け】Power BI Desktop のチュートリアルまとめ|効率化マンのメモ (yuatech-eng.com)
データ分析実施の流れ
データ分析フロー
一般的なデータ分析実施の流れは以下の通りです。
- データを取得
- データの変換
- データの紐づけ
- レポートの作成・発行
- レポートの共有
今回の記事では、データ分析の流れをPower BI を使って説明します。
シナリオ
本記事では、上司から売上データに関する3つの項目について質問をされたことを想定します。あなたは上司の質問に回答するためにPower BIを使って検討をします。
上司からの質問は以下の3つです。
- 最も売上が多かったのは、何年何月ですか?
- 最も売上が多かった年月で、最も利益が多かったのは、どの国ですか?
- 利益率が高いのは、どの製品とセグメントですか?
データを取得
データに接続し、Power BI にデータを読み込みます。
“サンプルデータセットを試す”を選択
“サンプルデータの読み込み”を選択
“ナビゲーター”ウィンドウが表示されました。
データの変換
一般的に業務で使うエクセルのデータは、データがきれいでない場合もあります。
例えばですが、
- 表記のばらつき:アメリカのことを”アメリカ”、”米国”、”USA”
- データ型が数字入力の項目に文字が入力されていた
元のエクセルデータを修正してから、Power BI Desktopに読み込み直すのも1つの方法ではあります。しかし、エクセルを手動で修正をすると”どのデータ”を”どういうふうに”修正したかが後からわからなくなる可能性があります。
また、Power BI DesktopにはPower Queryというパワフルなツールが用意されています。
今回は、Power Queryを使ったデータの変換を実施します。Power Queryはデータを取得する際に起動し、データの変換作業に使います。
データの変換は、たくさんありますが、例えば以下のものがあります。
- フィールドの名前、テーブルの名前の変更
- テーブルの行、列のデータ削除
- データ型の変更
Power Queryの起動
“Financial Sample.xlsx”のシート名の”financials”にチェックを入れた後、ナビゲーター ウィンドウ右側で、データを確認した後、”データの変換”を選択
Power Query エディタが起動しデータが表示されました。
Power Queryの画面構成については以下記事にてまとめましたので参考にしてください。
Power BI Desktopの画面構成 コレなんて呼ぶの?|効率化マンのメモ (yuatech-eng.com)
Excelでのデータの変換とPower Queryでのデータの変換の大きな違いとしては、Power Queryは、実施したデータの変換作業が自動で記録されるという点です。クエリの設定 ウィンドウの”適用したステップ”にPower Queryで実施された作業が記録されます。この作業は、データが新しく追加されても新しいデータに対しても適用されるため、一度設定をすれば後はデータを積み上げるだけになります。
データの変換作業
例として、以下の変換作業を実施します。
- “Units Sold”(販売台数)のデータ型を10進数から整数に変換
- “Country”(国名)をすべて大文字に変換
- “Month Name”を”Month”に変換
- 空白行の削除
“Units Sold”(販売台数)のデータ型を10進数から整数に変換
“Units Sold”列の列名横のデータ型のマークをクリック後、”整数”を選択
“列タイプの変更”ウィンドウの”現在のものを置換”を選択
“Country”(国名)をすべて大文字に変換
“Country”の列名の上で選択、その後、表示された”変換”を選択後、”大文字”を選択
“Month Name”を”Month”に変換
“Month Name”をダブルクリック後、”Month”に変更
空白行の削除
“Product”列名の横の”▼”を選択後、”空の削除”を選択
データの変換が完了しました。
“ホーム”タブを選択後、”閉じて適用”を選択し、Power Query エディターを閉じます。
フィールドウィンドウにデータが取り込まれました。Power Queryエディターで使った列名が表示されました。
日付テーブルの作成
Power BI Desktopで日付データを利用する場合は、日付テーブルを作成後、結合させることでデータ分析しやすくします。
“モデリング”タブを選択後、”新しいテーブル”を選択
数式バーに以下の式を入力し、Date テーブルを作成します。
Date = CALENDAR(DATE(2013,01,01),Date(2014,12,31))
データの紐づけ
データ分析を進めるには、複数のテーブルのデータを組み合わせて分析する機会は多々あります。列名が統一されていれば、Power BI Desktopが自動判定して、紐づけ(リレーションシップ)を作成してくれます。紐づけの設定状況は、モデル ビューで確認することが出来ます。
日付テーブルの紐づけ
モデル アイコンを選択し、モデルビューを表示する。
financials テーブルのDate フィールドをDate テーブルのDate フィールドにドラッグ&ドロップする。
financialsテーブルとDateテーブルのリレーションシップが作成されました。
レポートの作成・発行
グラフの作成作業は、レポート ビューで実施します。
レポート アイコンを選択し、レポート ビューを表示
レポートタイトルの追加
まずはレポートのタイトルを表示します。
挿入 タブを選択後、”テキストボックス”を選択
“売上報告書”と記入後、フォントサイズを18に変更し、ボックスのサイズを変更します。
年月毎の横棒グラフ
まずは、”最も売上が多かったのは、何年何月ですか?”の回答を検討します。
Power BI Desktop 積み上げ横棒グラフの作成 |効率化マンのメモ (yuatech-eng.com)
視覚化 ウィンドウの”積み上げ横棒グラフ”を選択
積み上げ横棒グラフの作成方法をまとめた以下のページも参考にしてください。
Power BI Desktop 積み上げ横棒グラフの作成 |効率化マンのメモ (yuatech-eng.com)
フィールド ウィンドウのfinancials テーブルの”Sales”フィールドを視覚化 ウィンドウの”X軸”にドラッグ&ドロップする。
フィールド ウィンドウのDate テーブルの”Date”フィールドを視覚化 ウィンドウの”Y軸”にドラッグ&ドロップする。
視覚化 ウィンドウのY軸の”四半期”横の”X”を選択し、”四半期”を除外
赤枠で囲んだアイコンをクリックし、ドリルダウンする。
“…”を選択後、”軸の並び替え”を選択し、”Salesの合計”を選択し、横棒グラフを並べ替える。
最も売上が多かったのは、2014年10月であることがわかりました。
国別の利益をマップで表示
次に、”最も売上が多かった年月で、最も利益が多かったのは、どの国ですか?”の回答を検討します。
視覚化 ウィンドウのマップを選択
積み上げ横棒グラフの作成方法をまとめた以下のページも参考にしてください。
Power BI Desktop マップの作成|効率化マンのメモ (yuatech-eng.com)
視覚化 ウィンドウの”マップ”を選択
フィールド ウィンドウの”Country”を視覚化 ウィンドウの”場所”に追加すると、世界地図が表示されます。
もし表示されない場合は、以下リンク先の”マップを初めて使う時のエラー対応”に対処方法を説明していますので参考にしてください。
Power BI Desktop マップの作成|効率化マンのメモ (yuatech-eng.com)
フィールド ウィンドウの”Profit”を視覚化 ウィンドウの”バブルサイズ”に追加
地図上にバブルが追加されました。今回はProfit(利益)をバブルサイズに設定したので、バブルサイズが大きいほど利益が大きいということになります。
最も売上が多い年月のデータのみを表示するため、棒グラフに表示されてる最も売上が多い年月である”2014 October”をクリックします。
マップに表示されてるデータは”2014 October”のみのデータでProfitが集計されます。
マップに表示されてるバブルの大きさを確認し、
最も売上が多い年月で、最も利益が多い国は、ドイツであることがわかりました。
製品とセグメントの利益率
最後に、”利益率が高いのは、どのセグメントのどの製品ですか?”の回答を検討します。
利益率の算出をします。
“モデリング”タグの ”新しいメジャー”を選択
数式を入力する部分に以下の式を記入後、数式以外の部分をクリックすると、フィールド ウィンドウに”Profit Ratio”が作成されます。
Profit ratio = sum(financials[Profit])/sum(financials[ Sales])
視覚化 ウィンドウの”集合縦棒グラフ”を選択
フィールド ウィンドウの”Segment”を視覚化 ウィンドウの”X軸”に追加
フィールド ウィンドウの”Product”を視覚化 ウィンドウの”X軸”に追加
X軸には、Segmentの下に、Productが表示するようにしてください。
フィールド ウィンドウの”Profit ratio”を視覚化 ウィンドウの”Y軸”に追加
セグメント毎で整理してから製品毎に利益率が整理されたことがわかります。
利益率が高い順番にグラフの並び替えを行います。
“…”を選択後、”軸の並び替え”、”Profit ratio”の順に選択
“…”を選択後、”軸の並び替え”、”降順で並び変え”の順に選択
利益率が高いのは、Channel PartnersセグメントのCareteraという製品であることがわかりました。
レポートが完成しましたので保存をします。
ファイル タグを選択
名前を付けて保存を選択
任意の場所に任意のファイル名で保存
*Power BI ファイルの拡張子は、pbixです。
レポートの共有
上司とのレポート共有は、Power BI サービスにて実施します。
Power BI サービスにPower BI Desktopで作成したレポートを発行します。
ホーム タグを選択後、”発行”を選択”
*変更を保存しますか?と確認された場合は、保存をしてください。
*サインインが求められたら職場のアカウントを入力ください
次に発行するワークスペースの確認画面が表示されます。保存場所をどこにするのかを聞かれていると理解いただければ大丈夫です。
職場で事前に”ワークスペース”が作成されていれば、ここで表示されます。今回は、既存で存在する”マイ ワークスペース”を選択後、”選択”をクリックします。
*ワークスペースとマイワークスペースの違いについて
簡単に説明をすると以下のイメージになります。詳細については別記事でまとめます。
ワークスペース:組織での共有フォルダ
マイワークスペース:個人フォルダ
発行が完了すると、次の表示がされます。
Power BI サービスでレポートを確認するために、リンクを選択。
Power BI サービスにレポートが発行できたため、ブラウザからPower BI Desktopで作成したレポートが表示されました。
このレポートを上司と共有しつつ、上司への回答をすれば完了になります。
まとめ
今回は、架空の業務を想定して、業務でよくあるPower BIの利用シナリオを体験いただきました。
Power BIを使ったデータ分析業務のイメージをつかんでいただき、あなたの業務にPower BIを活用いただければ幸いです。