Adjusted Rand Index on Test Set: 0.0006332050676187496
訓練セットが十分に大きければ、
k-Shape
法を用いた時系列クラスタリングモデルのテストセットで
の性能ももう少し良くなるはずだ。
13.4
k-Shape
法による時系列クラスタリング:
ECG5000
ECGFiveDays
データセットの訓練セットにはわずか
23
の観測点しかなく、テストセットにも
861
の
観測点しかない。もっと大きな心電図データセットを使ってみよう。
ECG5000
データセット(これも
UCR Time Series Archive
にある)には、訓練セットとテストセットを合わせて
5,000
の心電図(つまり
時系列データ)がある。
13.4.1
データの準備
データセットをロードして、独自の方法で訓練セットとテストセットに分割し直そう。
5,000
のうち
80%
を訓練セットに、
20%
をテストセットとする。訓練セットがはるかに大きくなったので、時系列ク
ラスタリングモデルの性能もはるかに良くなるはずだ。訓練セットに対しても性能は向上するだろうが、
最も重要なのはテストセットに対する性能向上だ。
# Load the datasets
current_path = os.getcwd() ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.
O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.