カテゴリ:データ分析
7月25日、「2019 OK」という小惑星が地球の近くを通り過ぎて行きましたが、NASAのサイト(https://cneos.jpl.nasa.gov/ca/)から、地球に接近した(これから接近する)小惑星についてのデータをダウンロードすることができます。
NEOが地球に接近した年月日時刻のデータが文字列としてダウンロードされるので、そこから日付データを取り出します。 「2019 OK」の年月日時刻の文字列:「2019-Jul-25 01:22 ± < 00:01」 最初は、「2019-Jul-25」の文字列を取り出して、セルの書式設定で日付データに変換できるかもしれない、と思ったのですが、どうやら英語の3文字の月名が邪魔をしているようで、セルの書式設定では日付データにできなかったため、関数を使うことになりました。 B列に接近年月日のデータがあり、B列から年月日のテキストを取り出すのですが、その際、Q列に英語の3文字の月名の列を用意して、MATCH関数で英語の月名を1から12の数字に変換しました。そして、DATEVALUE関数で日付データに変換しました。 なお、英語の月名を数字にしてしまえば、DATEVALUE関数なしで、セルの書式設定だけで日付データにすることができるようです。 【追記:ExcelやPower BIのPower Queryエディターで、年月日時刻の文字列のセルについて、「±」記号で、列の分割をすると、年月日時刻データとして認識されました。この方法が最も簡単なようです。】 B列に英語の月名(3文字)を含む年月日のテキストデータがある場合 =DATEVALUE(LEFT(B2,4)&"/"&MATCH(MID(B2,6,3),$Q$1:$Q$12,0)&"/"&RIGHT(B2,2)) Q列 Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec また、地球への接近距離のデータですが、「0.19 | 0.00048」のように、LDとauの2種類の単位のデータが「|」で区切られて、一つのセルに入っています。そこから、左側のLD(Lunar Distance)のデータを取り出します。 C列にデータがある場合:=LEFT(C2,FIND("|",C2)-1) 【追記:このようなデータの前処理はすべて、ExcelやPower BIのPower Query(パワークエリ)を利用することによって、より簡単に処理できることを確認しました。もはや、セル関数を使用する時代ではなくなったようです。Power Query(パワークエリ)を利用した方法は比べ物にならないくらい簡単で、繰り返しの作業にも対応しています。セル関数の利用がほとんど不要な時代になっているようです。】 前処理が終了したら、Power BIに読み込ませるだけです。Power BIで分析する作業よりも、データの下処理作業の方が大変なのは何とかならないものか、と思います。 データをダウンロードして利用する際、「日付データ」は結構やっかいです。 ダウンロードしたら、いきなりシリアル値が表示されていたりすることもありますが、シリアル値になっていればセルの書式設定を変えるだけで対応できるはずなのでまだましです。 日付データではないのに、日付データとして読み込まれる場合もあります。 あるサイトの表をコピーした際に、小惑星の推定サイズで「10-23」(10m~23m)というデータが「10月23日」になってしまうのは困りました。 セルの書式設定を文字列にすると、「10月23日」のシリアル値になってしまいます。つまり、一度「10月23日」の表示になってしまうと、セルの書式設定を文字列にするだけでは「10-23」の文字列に戻せないということになります。 幸い、NASAからダウンロードしたデータでは、このようなことがなくてよかったです。 ☆関連記事 ▼Microsoft PowerBI用データを準備するための前処理の例です:NASAのNEOデータをダウンロードし、小惑星の大きさの推定値をExcelで取り出し、単位変換して、Power BIに読み込む ▼地球をかすめた小惑星「2019 OK」は、0.2LD以下の距離に接近したNEOの中で過去最大だったようです:NASAの1万3千件以上のNEOデータから ▼小惑星「2019 OK」は、過去3年間に0.2LD以下まで地球に接近したNEOの中でも最大でした:NASAのNEOデータをPower BIで分析してみました ▼【グラフを追加しました】:小惑星「2019 OK」はOKでしたが・・・:7月25日に地球とニアミスした、今年最大の小惑星の名前です。 お気に入りの記事を「いいね!」で応援しよう
Last updated
2019.10.12 01:10:56
コメント(0) | コメントを書く
[データ分析] カテゴリの最新記事
|
|