Twitterの日本語データを分析したいです。
Hugging Faceを使えば簡単にポジティブ・ネガティブ分析ができるぞ
目次
ポジネガ分析について
本記事は後半部分が有料になっています。
本記事の価値は下記です。
- Twitterのデータをポジティブ・ネガティブ分析が可能になるこどでマーケティング分析が可能に
- Google Colabで動作できるようにしているので環境構築が不要かつ再現がしやすい
- Hugging Faceの使用方法が分かるため、他の自然言語処理の分析への応用がしやすくなる
購入しない方が良い方
- Pythonのコードに慣れていない方
- Deep Learningの基礎知識がない方
ポジネガ分析の概要
ポジネガを自動付与できているので学習の必要はないのですが、今回はHugging Faceに慣れるためにHugging Faceでの学習を入れています。
- Twitterからのデータを取得
- 学習データと評価データに分ける
- 学習データ、評価データにポジネガを自動付与
- Hugging FaceのBERTモデルで学習
- 学習したモデルで評価

環境構築
Google Colabで環境構築を行います。下記の記事を参考にしてください。
Twitterからのデータを取得
Twitterの認証処理
Twitterにログインして下記リンクにログイン
https://developer.twitter.com/en/portal/dashboard
Create Projectをしておくと新しいTwitter APIを使用できるのでプロジェクト作成から行います。

新しいTwitter APIは下記をご覧ください。
https://developer.twitter.com/en/docs/twitter-api/early-access
プロジェクト名を入力します。

ユースケースを入力します。今回はExploring the APIを選択しました。

プロジェクトの説明を記述します。

すでに作成されたAppを選ぶこともできますが今回はCreate a new Appを選択します。

App名を入力してcompleteを選択します。すでに使われている名前は使えないので注意が必要です。

API KeyとAPI secert key、Bearer tokenが取得できます。ここでAPI KeyとAPI secert key、Bearer tokenをメモしておきます。

日本語のデータを特定のクエリで取得するコードを記述します。
ここから先はコードがあるので有料です。