
6.1
テキスト形式のデータの読み書き
195
0 1 2 3
1 4 5 6
2 7 8 9
JSON
データの読み込みや操作に関する、さらに広範な事例(レコードがネストしている場合など)に
ついては、「14.4 アメリカ合衆国農務省の食糧データベース」の例を参照してください。
pandas
から
JSON
形式でデータをエクスポートする必要がある場合、
1
つの方法としては、シリーズ
やデータフレームの
to_json
メソッドが使えます。
In [71]: print(data.to_json())
{"a":{"0":1,"1":4,"2":7},"b":{"0":2,"1":5,"2":8},"c":{"0":3,"1":6,"2":9}}
In [72]: print(data.to_json(orient='records'))
[{"a":1,"b":2,"c":3},{"a":4,"b":5,"c
":6},{"a":7,"b":8,"c":9}]
6.1.5
XML
と
HTML
:ウェブスクレイピング
Python
には、巷にあふれる
HTML/XML
形式のデータの読み書き用のライブラリがたくさんありま
す。代表的なものとしては
lxml
(
http://lxml.de
)や
Beautiful Soup
、
html5lib
が挙げられます。これら
の中では通常、
lxml
がはるかに高速ですが、規格に従っていない
HTML
ファイルや
XML
ファイルを取
り扱うには、
Beautiful Soup
や
html5lib
の方が便利です。
pandas ...