MONTH

2022年9月

スクレイピングしたデータを解析しやすくする

前回の記事でスクレイピングをしました。そのデータを今回は使用します。 データの前処理 必要なライブラリをインポートします。 前回スクレイピングしたデータを読み込みます。 価格を取得するための関数を作成します。数字と漢字が混じっているだけなので数字だけ抽出する形にします。 抽出した”販売価格”を”販売価格(万円)”に入れ替えます。 年を抽出する関数を作成します。 抽出した”築年月”を”築年”に入れ替 […]

中古不動産物件をスクレイピングする

suumoのサイトを使用します。suumoのサイトは整理されているのでスクレイピングしやすいのがメリットです。 使用するライブラリ retry: スクレイピング処理をする場合に失敗した場合の再度スクレイピング処理をする際の設定ができます。 下記に各種パラメータの説明があるので、それを元に設定ができます。 https://pypi.org/project/retry/ BeautifulSoup4: […]

Close Bitnami banner
Bitnami