Episodio
Corrispondenza del processo di ripresa ed estensione per la corrispondenza dei documenti
Come trovare il candidato migliore per una posizione di lavoro (o viceversa) da un pool di milioni di documenti candidati? Questo compito è molto più difficile di quanto pensavamo, data la quantità scoraggiante di contenuti non strutturati e la natura complessa del problema di ricerca. Abbiamo usato Machine Learning e Cortana Analytics Suite per aiutare il client a sbloccare il valore dei Big Data. In particolare, abbiamo sviluppato e reso operativo una soluzione end-to-end che estrae dati non strutturati super complessi su candidati e specifiche di posizione e quindi apprende i modelli di buone corrispondenze. Machine Learning è un ottimo strumento per identificare modelli sottili tra documenti altrimenti diversi, ma la maggior parte delle implementazioni fatica a ridimensionare volumi di contenuto di grandi dimensioni e risultati in tempo reale a causa di problemi di scalabilità e prestazioni. Non è progettato per operare in tempo reale, ma un motore di ricerca è. Tramite l'indicizzazione iniziale dei documenti candidati, è possibile applicare rapidamente calcoli di vettori di termini tra un nuovo documento non indicizzato e l'intero corpus indicizzato. L'assegnazione dei punteggi viene applicata estraendo i termini principali con il tf-idf più alto dal documento di input ed eseguendo una query usando tali termini rispetto al contenuto indicizzato. In questo discorso verranno presentate le soluzioni e le procedure che integrano l'efficienza di Ricerca di Azure e la potenza di AML per la corrispondenza di curriculum/processi per ottenere una migliore scalabilità e prestazioni. Questa soluzione può essere estesa ad altri casi d'uso correlati alla corrispondenza dei documenti.
Collegamento al blog di Machine Learning:
Cortana Analytics Suite powers Russell Reynolds Associates ' Search for the Perfect Match
Come trovare il candidato migliore per una posizione di lavoro (o viceversa) da un pool di milioni di documenti candidati? Questo compito è molto più difficile di quanto pensavamo, data la quantità scoraggiante di contenuti non strutturati e la natura complessa del problema di ricerca. Abbiamo usato Machine Learning e Cortana Analytics Suite per aiutare il client a sbloccare il valore dei Big Data. In particolare, abbiamo sviluppato e reso operativo una soluzione end-to-end che estrae dati non strutturati super complessi su candidati e specifiche di posizione e quindi apprende i modelli di buone corrispondenze. Machine Learning è un ottimo strumento per identificare modelli sottili tra documenti altrimenti diversi, ma la maggior parte delle implementazioni fatica a ridimensionare volumi di contenuto di grandi dimensioni e risultati in tempo reale a causa di problemi di scalabilità e prestazioni. Non è progettato per operare in tempo reale, ma un motore di ricerca è. Tramite l'indicizzazione iniziale dei documenti candidati, è possibile applicare rapidamente calcoli di vettori di termini tra un nuovo documento non indicizzato e l'intero corpus indicizzato. L'assegnazione dei punteggi viene applicata estraendo i termini principali con il tf-idf più alto dal documento di input ed eseguendo una query usando tali termini rispetto al contenuto indicizzato. In questo discorso verranno presentate le soluzioni e le procedure che integrano l'efficienza di Ricerca di Azure e la potenza di AML per la corrispondenza di curriculum/processi per ottenere una migliore scalabilità e prestazioni. Questa soluzione può essere estesa ad altri casi d'uso correlati alla corrispondenza dei documenti.
Collegamento al blog di Machine Learning:
Cortana Analytics Suite powers Russell Reynolds Associates ' Search for the Perfect Match
Per inviare suggerimenti, Invia un problema qui.