Cykl życia procesu Nauka o danych zespołowego
Proces Nauka o danych zespołu (TDSP) zapewnia cykl życia, którego zespół może używać do tworzenia struktury projektów nauki o danych. Cykl życia przedstawia kroki, które można wykonać, aby pomyślnie ukończyć projekt.
Należy użyć tego cyklu życia, jeśli masz projekt nauki o danych, który jest częścią inteligentnej aplikacji. Inteligentne aplikacje wdrażają modele uczenia maszynowego lub sztucznej inteligencji na potrzeby analizy predykcyjnej. Możesz również użyć tego procesu do eksploracyjnych projektów nauki o danych i improwizowanych projektów analitycznych, ale może nie być konieczne zaimplementowanie każdego kroku cyklu życia.
Twój zespół może połączyć oparty na zadaniach zestaw TDSP z innymi cyklami życia nauki o danych, takimi jak standardowy proces wyszukiwania danych (CRISP-DM), odnajdywanie wiedzy w bazach danych (KDD) lub własny proces niestandardowy organizacji.
Cel i wiarygodność
Celem TDSP jest usprawnienie i standaryzacja podejścia do projektów nauki o danych i sztucznej inteligencji. Firma Microsoft zastosowała tę ustrukturyzowaną metodologię w setkach projektów. Naukowcy badali TDSP i opublikowali swoje odkrycia w literaturze z przeglądem równorzędnym. Struktura architektoniczna TDSP jest dokładnie przetestowana i sprawdzona w wielu obszarach.
Pięć etapów cyklu życia
Cykl życia TDSP składa się z pięciu głównych etapów, które zespół wykonuje iteracyjnie. Te etapy obejmują:
Oto wizualna reprezentacja cyklu życia TDSP:
Cykl życia TDSP to sekwencja kroków, które zawierają wskazówki dotyczące tworzenia modeli predykcyjnych. Twój zespół wdraża modele predykcyjne w środowisku produkcyjnym, którego planujesz używać do tworzenia inteligentnych aplikacji. Celem tego cyklu życia procesu jest przejście do projektu nauki o danych w kierunku jasnego punktu końcowego zaangażowania. Nauka o danych to ćwiczenie w badaniach i odkryciach. Jeśli używasz dobrze zdefiniowanego procesu do przekazywania zadań zespołowi, zwiększasz prawdopodobieństwo pomyślnego przeprowadzenia projektu nauki o danych.
Każdy etap ma własny artykuł, który zawiera opis:
- Cele: Cele etapu.
- Jak to zrobić: konspekt zadań wykonywanych na etapie i wskazówki dotyczące sposobu ich ukończenia.
- Artefakty: elementy dostarczane, które należy utworzyć podczas etapu i zasobów, których można użyć, aby je utworzyć.
Recenzowane cytaty równorzędne
Naukowcy publikują literaturę z przeglądem równorzędnym na temat TDSP. Zapoznaj się z następującym materiałem, aby zbadać funkcje i aplikacje TDSP.
Inżynieria oprogramowania na potrzeby uczenia maszynowego: analiza przypadku (strony 291-300)
Cykl życia sztucznej inteligencji: od koncepcji do produkcji
Zarządzanie artefaktami cyklu życia uczenia maszynowego: ankieta (strony 18–35)
Konstruowanie modelu jakości dla systemów uczenia maszynowego (strony 307–335)
Współautorzy
Ten artykuł jest obsługiwany przez firmę Microsoft. Pierwotnie został napisany przez następujących współautorów.
Główny autor:
- Mark Tabladillo | Starszy architekt rozwiązań w chmurze
Aby wyświetlić niepubalne profile serwisu LinkedIn, zaloguj się do serwisu LinkedIn.
Powiązane zasoby
- Aby zapoznać się z pierwszym etapem cyklu życia, zobacz Omówienie firmy.
- Co to jest proces Nauka o danych zespołu?
- Porównanie produktów i technologii uczenia maszynowego