Rozdział 6. Podobieństwo, sąsiedzi i klastry
Podstawowe pojęcia: Obliczanie podobieństwa obiektów opisanych przez dane; Wykorzystywanie podobieństwa do celów predykcji; Klastrowanie jako segmentacja oparta na podobieństwie.
Przykładowe techniki: Poszukiwanie podobnych jednostek; Metody najbliższych sąsiadów; Metody klastrowania; Miary odległości do obliczania podobieństwa.
Podobieństwo leży u podstaw wielu metod nauki o danych i rozwiązań problemów biznesowych. Jeżeli dwa obiekty (osoby, firmy, produkty) są pod jakimiś względami podobne, to często dzielą także inne cechy. Procedury eksploracji danych bywają często oparte na grupowaniu obiektów według podobieństwa lub na poszukiwaniu „właściwego” rodzaju podobieństwa. W sposób dorozumiany zapoznaliśmy ...
Get Analiza danych w biznesie. Sztuka podejmowania skutecznych decyzji now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.