カテゴリ:データ分析
今朝(10月9日朝)、"地震"というキーワードを含むツイートを収集してみました。
Rのrtweetで無料で収集できるのは、上限18000件、期間が1週間までです。ツイートが少ないキーワードの場合は、1週間遡っても18000件に達しない場合があります。逆に、ツイートが非常に多いキーワードの場合は収集時点の直近のものしか収集できません。 さて、"地震"を含むツイートは上限の18000件にすぐ達してしまいました。 7時頃にrtweetを走らせたところ、約1時間分しか収集できませんでした。つまり、6時から7時までのツイートで18000件に達してしまいました。 下の画像は、ワードクラウドです。ワードクラウドでは、出現件数の多い単語が大きく表示されます。 ワードクラウドから、パキスタンでも地震があったことがうかがえます。 「兄ちゃん」という単語は、「お兄ちゃん武士?」「無事でござる」というLINEのやりとりの画像のことのようです。「お兄ちゃん武士?」で検索してみてください。 もしかすると、「微笑ましい実話」ではなく「フィクション」なのかもしれませんが。 単語のネットワーク図では、「兄ちゃん」「安否」「確認」「誤字」「サムライ」「妹」「LINE」ときれいにつながっています。 リツイートが多いと、同じ文章がたくさんあるので、きれいにネットワーク図に表れてきます。 昨日は出勤困難者がたくさんいたようです。リモートワークは、こんな時のためにあるのではないでしょうか。 ↓下の画像は、ハッシュタグクラウドです。 「#中川船番所資料館」は、下記のツイート内のものでした。魚や鳥も地震に反応したようです。 これも単語のネットワーク図で表示されていました。ネットワーク図を見ただけでは何のことかわかりませんでしたが、後から「そういうことか」と気づきました。
: お気に入りの記事を「いいね!」で応援しよう
Last updated
2021.10.10 21:16:15
コメント(0) | コメントを書く
[データ分析] カテゴリの最新記事
|
|