Python プログラミング

[Python] HTMLファイルからtableタグの内容をCSVファイル化する方法

投稿日:

こんにちは!シミダイ(@shimidai2100)です。

PythonでHTMLファイルのテーブルタグをCSVファイルにを作成してみました。

↓がソースになります。


解説

今回は「pandas」というモジュールを使用します。

利用するためには2行目でまずpandasをimportしております。

デフォルトコンポーネントではないので、入れていない人は「pip」でインストールしましょう。

pandasはデータ解析によく使われるモジュールで、データ解析に必要な機能はほぼそろっています。

今回は7行目で「htmlの取得」と「取得したデータのCSV化」を利用しています。

HTML通信用の「requests」モジュールとHTML解析用の「BeautifulSoup4」を使用すれば、もっと細やかな解析ができます。

tableタグからCSVファイル抽出するだけならば「pandas」をオススメします。

公式http://pandas.pydata.org/

スポンサードリンク

関連記事

-Python, プログラミング

Translate »

Copyright© shimidai2100 , 2018 All Rights Reserved.