Yosoku GIS 利用ガイド Ver1.0
開発の目的
チェーン店を持つ企業が新規に出店する場合、その候補地の売上が幾らになるかは決裁の最も重要なポイントになります。
予測売上を統計学に基づいて算出し予測売上の根拠を示せれば説得力も高くなります。
予実差は出店コストやその後の投資回収や資金返済、運営に大きな影響がでるので少しでもその誤差を無くす。
また、現地に行かなくても人口統計、商業統計、駅乗降客者数のデータからある程度許容できる予測値を如何に出すか、適正化を目指すものです。
利用上の注意点
予測に活用しているモデルは機械学習のランダムフォレストと重回帰分析です。
店舗数が多い場合はモデル生成に数時間を要します。PCやネットワーク環境にも生成時間は左右されます。
なるべくスペックの高いPCをお使いいただくことを推奨します。
また、予測は絶対ではありません。予測売上を最終的に決めるのは担当者です。企業の戦略や過去の経験等も十分考慮して決定することが必要になります。
推奨環境
OS | Windows 10 |
---|---|
ブラウザ | Google Chrome 最新版 |
アップロードするCSV形式
拡張子: | CSV(カンマ区切り) |
---|---|
文字コード: | UTF-8 |
※ ダブルクォーテーションは自動で消去されます。
※ Shift-JISなどを使用している場合は、UTF-8フォーマットに変換してください。
登録するユーザ・店舗情報
項目名 | データ型 | 制限内容 | 必須/任意 |
---|---|---|---|
店舗No. | 数値 | 0〜1000000 | 必須 |
店舗名 | 文字列 | 1〜20文字以内 | 必須 |
住所 | 文字列 | 5〜100文字以内 | 必須 |
売上額 | 数値 | 0〜100000000000 | 必須 |
業種 | 文字列 | 1〜20文字以内 | 必須 |
エリアタイプ | 文字列 | 1〜20文字以内 | 必須 |
座席数 | 数値 | 0〜1000 | 座席数、座席タイプのどちらかは必須 |
座席タイプ | 数値 | 0〜10 | 座席数、座席タイプのどちらかは必須 |
最寄り駅 | 文字列 | 0〜100文字以内 | 任意 |
売場面積 | 数値 | 0〜1000000 | 必須 |
座標 | 文字列 | 0〜30文字以内 | 任意 |
ユーザ定義のデータ項目名 | 文字列 | 1〜20文字以内 | 必須 |
ユーザ定義のデータ項目(数値) | 数値 | -10000000〜10000000 | 任意 |
ユーザ定義のデータ項目(リスト) | 文字列 | 1〜300文字以内 | 文字列を選択した場合必須 |
ユーザ定義のデータ項目(リスト内の各項目) | 文字列 | 1〜20文字以内 | 文字列を選択した場合必須 |
ユーザ表示名 | 文字列 | 1〜20文字以内 | 必須 |
部署名 | 文字列 | 1〜20文字以内 | 必須 |
使用している統計データ
- 国土数値情報 駅別乗降客者数データ(国土交通省)(2020年6月23日取得)
- 「政府統計の総合窓口(e-Stat)」平成27年国勢調査(総務省)
- 「政府統計の総合窓口(e-Stat)」平成28年経済センサス活動調査(総務省)
- 平成26年商業統計(経済産業省) 500mメッシュデータ:世界測地系、データ範囲 全国
※ URIは2021年3月5日アクセス確認
このサービスは、政府統計総合窓口(e-Stat)のAPI機能を使用していますが、サービスの内容は国によって保証されたものではありません。
売上を予測するまでの流れ
ログインする
サービスを利用するにはアカウント登録する必要があります。
登録していない場合は登録を行ってください。
既にログインしている場合は操作不要です。
既存店舗を追加する
- 必要に応じて ユーザ定義のデータ項目 を追加します。(任意)
- 統計データを取得したい同心円の半径を選択します。(①)
※ 初期設定は500mになっています。 - 「入力エリア」の「既存の店舗を追加」をクリックします。(②)
- テンプレートファイルをダウンロードします。(③)
- ダウンロードしたCSVファイルに表頭に則してデータを入力します。
- Windowsの場合エクスプローラからドラッグ&ドロップするか、点線枠内の「店舗データをアップロード」をクリックしファイル選択画面よりファイルを指定して「開く」ボタンをクリックします。(④)
- ファイルのアップロード前に設定した同心円の半径でデータが取得されます。
ファイルのアップロードはデータサイズに依存してアップロード時間が長くなります。
出店候補地を追加する
- 「入力エリア」の「既存の店舗を追加」をクリックします。(①)
- ②枠内の項目を全て入力します。
「ユーザ定義のデータ項目」を設定している場合は、それらの項目も入力してください。 - 「追加」を押します(③)
- 画面が暗くなり、データが取得されます。
データの取得が完了し、再び画面が明るくなれば追加完了です。
データを取得する同心円の半径は、必ず既存店舗と一致させてください。
売上結果を予測する
予測方法には2種類あります。
MAPページは3つの構成になっています。
-
① 『入力エリア』
検索したい住所や出店候補地の住所を入力します。
また、複数店舗をCSVで一括アップロードが可能です。 ② 『地図エリア』
登録した店舗や入力した住所などが表示されます。
また選択された地域の人口密度を色分けして表示することもできます。③ 『出力エリア』
選択された住所の人口、商業データが表示されます。
売上を予測する場合はその結果が表示されます。
1.入力エリアの基本操作
住所検索
- 展開して住所を入力すると地図が指定した住所に移動します。
- 地図を拡大して赤いマークの辺りをクリックすると、画面が暗くなり統計データが取得されます。
- データの取得が完了すると「出力エリア」>「選択した地点」に最寄り駅の乗降客者数、人口統計、商業統計が表示されます。
既存店舗を追加
出店候補地を追加
2.地図エリア
- 地図上をスクロールすると地図の拡大縮小ができます。
(※ タッチ可能な端末ではピンチイン/アウトで拡大縮小が可能です。) - 地図上の色分けされた人口密度の情報は都道府県を指定することで調べたいエリアが色分けされます。
デフォルトは東京都です。
地図上で統計データを取得する
- 地図上の任意の地点をクリックすると、統計データが取得され、そこを中心として同心円とメッシュが表示されます。
- 地図上の任意の地点をクリックして表示されたマーカーを右クリックすることで同心円、メッシュの表示切り替え、マーカー自体の削除ができます。
住所検索機能を活用する
- 住所を入力すると地図が移動し、赤いマーカーが打たれます。
- 赤いマーカーピンはクリックすると消去されます。
再度表示したい場合は「住所検索」の入力欄をクリックし、入力欄周辺をクリックすると再表示されます。
3.出力エリア
『乗降客者数』タブ
選択された地点に最も近い駅の乗降客者数が表示されます。
過去の乗降客者数推移データが表示されます。
『選択した地点』タブ
近隣駅の乗降客者数が表示されます。
最新の国勢調査、経済センサス活動調査、商業統計が選択した同心円距離内のデータが表示されます。
『統計分析』タブ
売上の予測を行い、その結果が表示されます。
『既存店舗』タブ
読み込まれた全ての店舗に関する情報が表示されます。
『出店候補地』タブ
「出店候補地を追加」から追加した店舗に関する情報が表示されます。
機械学習で予測する
手順
- 複数の既存店舗の情報をアップロードします。(既に読み込んである場合は不要)
- 「統計分析」タブを選択します。(①)
- 「機械学習」を選択します。(②)
- 「新規予測モデル生成」ボタンをクリックします。(③)
- 画面が暗くなり、画面左下に計算する件数が表示されます。
- 計算が終わると、店舗名が記された下に予測結果が下に表示されますのでスクロールバーで調整し結果を確認してください。
下記のようなメッセージが出た場合は待機をクリックしてください。
予測結果はアップロードした店舗数に依存し店舗数が多いと数時間必要となる場合があります。
結果の見かた
- モデルに使用された店舗(①)
- 計算モデルに使用されたデータ項目(②)
機械学習で予測に活用された統計データ等の項目が表示されます。 - 既存店舗の実測値と予測された売上の比較(③)
生成した予測モデルの当てはまりがグラフで表示されます。
縦軸が予測売上、横軸が実績売上となりますので、直線にプロットが近いほど予測の当てはまりは良いことになります。 - 出店候補地の予測結果(④)
追加した出店候補地の売上の予測結果が表示されます。
モデル2について
機械学習では予測するデータで2グループに分けて予測モデルを生成します。
各モデルのタイトル下部に表示された店舗で1グループとなります。
結果は1つめのモデル(モデル1)の結果の下に表示されます。
2つめのモデル(モデル2)の結果もモデル1と同様に分類された店舗名と、モデル生成に活用された統計データ等の項目が表示されます。
モデル2の予測モデルの当てはまりもグラフで表示されます。
縦軸が予測売上、横軸が実績売上となりますので直線にプロットが近いほど予測の当てはまりは良いことになります。
重回帰分析で予測する
手順
- 複数の既存店舗の情報をアップロードします。(既に読み込んである場合は不要)
- 「統計分析」タブを選択します。(①)
- 「重回帰分析」を選択します。(②)
重回帰分析を選択するとアップロードした店舗が出現します。 - 予測モデルの生成に使用する店舗を選択します。(③)
「全て選択」ボタンをクリックすると全ての店舗の売上を基に予測モデルを生成します。 - 売上を予測するための説明変数を選択します。(④)
人口統計、商業統計などから選択できます。 - 選択が完了したら「新規予測モデル生成」をクリックします。(⑤)
選択数が多くなると予測モデル生成に数時間単位で生成時間が長くなる場合がありますのでご注意ください。
5つぐらいを上限に選択することをお勧めします。
下記のようなメッセージが出た場合は待機をクリックしてください。
統計データの各項目名にマウスを近づけると売上との相関係数が表示されますので参考にしてください。
「データ関係をみる」を押すと売上との相関係数の一覧を表示できます。
- 「新規予測モデル生成」をクリックすると、画面が暗くなり画面左下に予測の進行状況が表示されます。
- 計算が終了すると、重回帰分析の結果が表示されます。
予測結果を見て当てはまりを確認してください。
結果の見かた
- モデルの評価(①)
- 計算モデルに使用されたデータ項目(②)
予測に活用された統計データ等の項目が表示されます。 - 既存店舗の実測値と予測された売上の比較(③)
生成されたモデルを使って計算した売上と実績売上がプロットされます。
直線上にプロットされれば予測精度が高いことになります。
直線との離れぐあいを見て確認してください。 - 出店候補地の予測結果(④)
追加した出店候補地の売上の予測結果が表示されます。
ユーザ定義のデータ
「ユーザ定義のデータ項目」とは
エリアタイプ、座席情報、最寄り駅、売り場面積、統計データ以外で利用者が独自に設定できる項目です。
予測モデルの生成時に説明変数として追加されます。
登録した項目は全て入力必須項目になりますので、店舗を登録する前に設定することをおすすめします。
利用手順
- マイページを開く
- 画面左のメニューから「ユーザ定義のデータ項目を登録する」を選択します。(①)
- 項目名を入力します。(②)
※ 項目名には任意の名前を入力できます。わかりやすい名前で登録することをおすすめします。 - データ型を選択します。(③)
「ユーザ定義のデータ項目」には文字列型、数値型の2種類が利用できます。 - (文字列を選択した場合)
カテゴリデータとして扱われるため、事前に、入力されうる値のリストを登録してください。(④) - 追加ボタンを押します。(⑤)
項目数が増加すると、予測にかかかる時間も増加します。