Perché così tanti dati che gli scienziati stanno lasciando i loro lavori – Verso una Scienza di Dati

Il mio prendere su perché i dati di scienziati e di machine learning per ingegneri in cima alla lista di sviluppatori cercando nuovi posti di lavoro. Esso mette in evidenza il lato meno glamour di scienza di dati
quanto dati gli scienziati a fare

Le frustrazioni dei dati scienziato!

Sì, io sono un data scientist e sì, avete letto il titolo correttamente, ma qualcuno doveva dirlo. Abbiamo letto tante storie circa i dati che la scienza è il più sexy di lavoro del 21 ° secolo e la bella somma di denaro che si può fare come un data scientist che può sembrare il sogno assoluto di lavoro. Fattore che il campo contiene un’abbondanza di personale altamente specializzato geeking fuori per risolvere problemi complessi (sì, è una cosa positiva per “geek”), c’è tutto, amore per il lavoro.

Ma la verità è che i dati di scienziati in genere “passare 1-2 ore alla settimana alla ricerca di un nuovo lavoro”, come indicato in questo articolo del Financial Times. Inoltre, l’articolo afferma anche che “Machine learning specialisti sormontato sua lista di sviluppatori che ha detto che stavano cercando un nuovo lavoro, a 14,3 per cento. Dati gli scienziati sono stati in un secondo vicino, al 13,2 per cento.” Questi dati sono stati raccolti da un Overflow dello Stack nella loro indagine basata su di 64.000 sviluppatori.

Anch’io sono stato in quella posizione e di recente hanno dati a commutazione di scienza posti di lavoro di me stesso.

Allora, perché sono così tanti dati scienziati in cerca di nuovi posti di lavoro?

Prima di rispondere a questa domanda devo chiarire che io sono ancora un data scientist. Nel complesso, mi piace il lavoro e non voglio scoraggiare altri dal aspirano a essere dati gli scienziati, in quanto può essere divertente, stimolante e gratificante. Lo scopo di questo articolo è quello di fare l’avvocato del diavolo, e di esporre alcuni degli aspetti negativi del lavoro.

Dal mio punto di vista, qui ci sono 4 grandi motivi per cui penso che molti scienziati dati sono insoddisfatti con i loro lavori.

1. Aspettativa non corrisponde alla realtà

Questa citazione è così apt. Molti giovani ricercatori so (incluso me stesso) ha voluto entrare in scienza di dati perché era tutto circa la risoluzione di problemi complessi, con freschi nuovi algoritmi di machine learning che fare enorme impatto sul business. È stata questa l’occasione per sentire come il lavoro che stavamo facendo era più importante di qualsiasi cosa abbiamo fatto prima. Tuttavia, questo non è spesso il caso.

A mio parere, il fatto che l’aspettativa non corrisponde alla realtà è la ragione per cui molti scienziati dati di lasciare. Ci sono molte ragioni per questo, e forse non posso venire con un elenco esaustivo, ma questo post è essenzialmente un elenco di alcuni dei motivi per cui l’ho incontrato.

Ogni azienda è diversa, quindi non posso parlare per tutti, ma molte aziende di noleggio di dati di scienziati, senza una adeguata infrastruttura per iniziare a ottenere il valore di AI. Questo contribuisce all’avviamento a freddo il problema AI. Coppia questo con il fatto che queste aziende non riescono a noleggio senior, esperti di dati praticanti prima di assumere juniores, adesso avete una ricetta per un disilluso e relazione infelice per entrambe le parti. I dati scienziato probabilmente è venuto a scrivere smart algoritmi di machine learning per auto insight, ma non può fare questo perché il loro primo lavoro è quello di ordinare i dati di infrastrutture e/o creare report analitici. Al contrario, l’azienda voleva solo un grafico che si potranno presentare nella loro riunione del consiglio di amministrazione di ogni giorno. La società quindi si sentono frustrati perché non vedono il valore di essere spinto abbastanza in fretta e tutto questo porta a dati scienziato di essere infelici nel loro ruolo.

È importante valutare le nostre aspirazioni allineare con il percorso critico dell’ambiente in cui ci troviamo. Trovare i progetti, le squadre e le società il cui percorso critico migliori allineati con la vostra.

Questo mette in evidenza il 2-relazione tra datore di lavoro e i dati di scienziato. Se la società non è nel posto giusto e ha obiettivi in linea con quello dei dati scienziato quindi ci sarà solo una questione di tempo prima che i dati scienziato trovare qualcos’altro.

Per coloro che sono interessati Samson Hu ha una fantastica serie su come analytics squadra è stata costruita alla voglia che ho trovato anche molto perspicace.

Un altro motivo che i dati scienziati delusi è una simile ragione per cui sono stato deluso con il mondo accademico, ho creduto che sarei in grado di fare un grande impatto sulla gente ovunque, non solo all’interno dell’azienda. In realtà, se il core business dell’azienda, non è la macchina di apprendimento (il mio precedente datore di lavoro è una media publishing company), è probabile che la scienza di dati che devi fare è solo andare a fornire piccoli guadagni incrementali. Questi possono aggiungere fino a qualcosa di molto significativo, o si può avere la fortuna di inciampare in una miniera d’oro di progetto, ma questo è meno comune.

2. La politica regna sovrana

Il problema della politica ha già un brillante articolo ad esso dedicato: La cosa più difficile in data science: la politica e vi esorto a leggerlo. Il primo paio di frasi dall’articolo descrivono bene ciò che voglio dire:

Quando ero svegliarsi alle 6 del mattino per studiare Support Vector Machines , ho pensato: “Questo è veramente dura! Ma, hey, almeno io diventare molto importante per il mio futuro datore di lavoro!”. Se avessi la macchina del tempo, tornerei indietro nel tempo e chiamata “Tori** * o!” su di me.

Se seriamente pensare di conoscere un sacco di algoritmi di machine learning farà i dati più importanti scienziato poi tornare al mio primo punto di cui sopra: aspettativa non corrisponde alla realtà.

La verità è che le persone del settore con il maggior peso è necessario avere una buona percezione di voi. Che può significare che devi sempre fare il lavoro ad hoc come ottenere numeri da un database di dare alle persone giuste al momento giusto, facendo progetti semplici solo in modo che la gente di destra hanno la giusta percezione di voi. Ho dovuto fare un sacco nel mio precedente posto. Come frustrante come si può sentire, era una parte necessaria del processo.

3) Tu vai a persona circa qualche cosa di dati

In seguito facendo di tutto per compiacere le persone giuste, quelle stesse persone con tutto il peso spesso non si capisce cosa si intende per “data scientist”. Ciò significa che sarete l’esperto di analisi dei dati nonché la segnalazione ragazzo e non dimentichiamo che sarete esperto database.

Non si tratta solo di non tecnici, dirigenti che fare troppe supposizioni circa le vostre abilità. Gli altri colleghi che la tecnologia si supponga di sapere tutto di dati correlati. Si conosce il modo per aggirare Scintilla, Hadoop, Hive, Pig, SQL, Neo4J, MySQL, Python, R, Scala, Tensorflow, A/B Testing, PNL, nulla di apprendimento automatico (e quant’altro i dati relativi che si può pensare — ma se si vede un lavoro specifica, con tutti questi scritti su di esso, rimanere ben chiaro. Puzza di un lavoro spec da una società che non ha alcuna idea di ciò che i loro dati strategia e assumeranno nessuno, perché pensano che l’assunzione di eventuali dati persona che risolverà i loro problemi).

Ma non si ferma lì. Perché lei sa tutto questo e , ovviamente, hanno accesso a TUTTI i dati, ci si aspetta di avere le risposte a TUTTE le domande……. bene, dovrebbe atterrato in persona rilevante posta in arrivo 5 minuti fa.

Cercando di dire a tutti ciò che è realmente conoscere e di avere il controllo può essere difficile. Non perché qualcuno effettivamente pensare di meno a voi, ma perché come junior dati scienziato con poca esperienza nel settore ti preoccupare che la gente pensa di meno di voi. Questo può essere abbastanza una situazione difficile.

4) Lavorare in un team isolato

Quando vediamo dei dati di successo di prodotti spesso di vedere sapientemente progettato interfacce utente con funzioni intelligenti e, soprattutto, di un utile di uscita che, almeno, è percepito dagli utenti per risolvere una pertinenti problema. Ora, se un data scientist trascorre il loro tempo solo per imparare a scrivere ed eseguire algoritmi di apprendimento automatico, quindi possono solo essere un piccolo (ma necessario) parte di un team che porta al successo di un progetto che produce un prezioso prodotto. Questo significa che i dati della scienza squadre che lavorano in isolamento di lotta di fornire un valore aggiunto!

Nonostante questo, molte aziende hanno ancora dati della scienza squadre che si presentano con i loro progetti e scrivere il codice per provare a risolvere un problema. In alcuni casi questo può bastare. Per esempio, se tutto ciò che serve è un foglio di calcolo statico che viene prodotto una volta al trimestre quindi può fornire qualche valore. D’altra parte, se l’obiettivo è quello di ottimizzare fornire suggerimenti intelligenti in siti web su misura prodotti per l’edilizia, quindi questo comporterà molte competenze diverse, che non dovrebbe essere previsto per la stragrande maggioranza degli scienziati dati (solo la vera scienza di dati unicorno in grado di risolvere questo). Quindi, se il progetto è assunto da una isolata data science team è più probabilità di esito negativo (o prendere un tempo molto lungo, perché l’organizzazione isolato team al lavoro sul progetto di collaborazione nelle aziende di grandi dimensioni non è facile).

Quindi, essere un efficace dati scienziato nel settore non basta solo fare bene in Kaggle concorsi e completare alcuni corsi on-line. (Onu)per fortuna (a seconda che la si guardi) comporta la comprensione di come le gerarchie e la politica funziona in business. Trovare una società che è in linea con il tuo percorso critico dovrebbe essere un obiettivo chiave quando si cerca una data science di lavoro che soddisferà le vostre esigenze. Tuttavia, si può ancora bisogno di regolare le vostre aspettative di ciò che si aspetta da un data science di ruolo.

Se qualcuno ha ulteriori commenti, domande o obiezioni, non esitate a commentare, perché una discussione costruttiva che è necessario per aiutare gli aspiranti scienziati dati prendere decisioni informate circa il loro percorso di carriera.

Leave a Reply

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *