
11.2
時系列の基本
351
In [36]: idx
Out[36]: DatetimeIndex(['2011-07-06 12:00:00', '2011-08-06 00:00:00', 'NaT'], dty
pe='datetime64[ns]', freq=None)
In [37]: idx[2]
Out[37]: NaT
In [38]: pd.isnull(idx)
Out[38]: array([False, False, True], dtype=bool)
NaT
(
Not a Time
)というのは、
pandas
でのタイムスタンプ型のデータにおける欠損値のことです。
dateutil.parser
は便利ですが、完璧なツールではありません。というのも、一部の日付と
して認識して欲しくない文字列を日付と認識してしまいます。例えば、
'42'
は
2042
年の今
日の日付と認識されてしまいます。
datetime
オブジェクトは、他国や多言語における特定のロケール向けの書式オプションも多く持っ
ています(表11-3参照)。例えば、月の名前の省略形はドイツ語とフランス語では、英語と異なります。
表11-3 特定のロケール向けの日付書式
型 説明
%a
曜日の省略形。
%A
曜日を完全に表現したもの。
%b
月の省略形。
%B
月を完全に表現したもの。
%c
日付と時間を完全に表現したもの。例:「
Tue 01 May 2012 04:20:57 PM
」
%p
ロケールでの午前と午後を表したもの。
AM
や
PM
。
%x
ロケール