Samenvatting

Voltooid

In deze module hebt u geleerd hoe u Python kunt gebruiken om gegevens te verkennen, visualiseren en bewerken. Gegevensverkenning vormt de kern van gegevenswetenschap en is een belangrijk element in gegevensanalyse en machine learning.

Machine learning is een subset van gegevenswetenschap die betrekking heeft op voorspellende modellering. Met andere woorden, machine learning maakt gebruik van gegevens om voorspellende modellen te maken om onbekende waarden te voorspellen. U kunt machine learning gebruiken om te voorspellen hoeveel voedsel een supermarkt nodig heeft om te bestellen of om planten in foto's te identificeren.

Machine learning werkt door relaties tussen gegevenswaarden te identificeren die de kenmerken van iets beschrijven ( de kenmerken, zoals de hoogte en kleur van een plant) en de waarde die we willen voorspellen (het label, zoals de soort plant). Deze relaties zijn ingebouwd in een model via een trainingsproces .

Uitdaging: Vluchtgegevens analyseren

Als de oefeningen in deze module u hebben geïnspireerd om gegevens voor uzelf te verkennen, waarom kunt u de uitdaging niet aangaan van een echte gegevensset met vluchtrecords van het Amerikaanse ministerie van Transport? U vindt de uitdaging in het notebook 01 - Flights Challenge.ipynb !

Notitie

De tijd voor het voltooien van deze optionele uitdaging is niet opgenomen in de geschatte tijd voor deze trainingsmodule. Je kunt er zo weinig of zoveel tijd aan besteden als je wilt!