Aktualne duże zbiory danych: jak wypełnić lukę między naukowcami danych i inżynierami

Tłum wokół dużych zbiorów danych spowodował powszechne nieporozumienie: że samo ich istnienie może zapewnić firmie praktyczne informacje i pozytywne wyniki biznesowe. Rzeczywistość jest nieco bardziej skomplikowana. Aby czerpać korzyści z dużych zbiorów danych, potrzebujesz zdolnego zespołu analityków danych, aby je przesiać. W przeważającej części korporacje to rozumieją, o czym świadczy 15x - 20-krotny wzrost liczby miejsc pracy naukowców w latach 2016-2019. Jednak nawet jeśli masz pod ręką zdolny zespół naukowców danych, nadal musisz pokonać główną przeszkodę wdrażanie tych pomysłów w produkcję. Aby zrealizować prawdziwą wartość biznesową, musisz upewnić się, że inżynierowie i naukowcy danych współpracują ze sobą. U ich podstaw naukowcy zajmujący się danymi są innowatorami, którzy wydobywają nowe pomysły i przemyślenia z danych, które Twoja firma codziennie spożywa, podczas gdy inżynierowie z kolei wykorzystują te pomysły i tworzą zrównoważone obiektywy do przeglądania naszych danych. Naukowcy zajmujący się danymi mają za zadanie odszyfrować, manipulować i promować dane w celu uzyskania pozytywnych wyników biznesowych. Aby tego dokonać, wykonują różnorodne zadania, od eksploracji danych po analizę statystyczną. Zbieranie, organizowanie i interpretacja danych odbywa się w celu zidentyfikowania istotnych trendów i istotnych informacji. Podczas gdy inżynierowie z pewnością współpracują z naukowcami danych, istnieją pewne wyraźne różnice między tymi dwiema rolami. Jedną z podstawowych różnic jest to, że inżynierowie przykładają zdecydowanie większą wagę do „gotowości produkcyjnej” systemów. Od odporności i bezpieczeństwa modeli generowanych przez naukowców zajmujących się danymi do faktycznego formatu i skalowalności, inżynierowie chcą, aby ich systemy były szybkie i niezawodne. Innymi słowy: badacze danych i zespoły inżynierów mają różne codzienne obawy. To nasuwa pytanie, w jaki sposób można ustawić obie role na sukces, a ostatecznie wydobyć najbardziej znaczące spostrzeżenia z danych? Odpowiedź polega na poświęceniu czasu i zasobów na doskonalenie danych i relacji inżynierskich. Tak jak ważne jest ograniczenie bałaganu lub „szumów” wokół zestawów danych, ważne jest również, aby wygładzić wszelkie tarcia między tymi dwoma zespołami, które odgrywają istotną rolę w sukcesie biznesowym. Oto trzy kluczowe kroki, aby urzeczywistnić to. Nie wystarczy po prostu umieścić kilku naukowców i kilku inżynierów w pokoju i poprosić ich o rozwiązanie problemów na świecie. Najpierw musisz sprawić, by zrozumieli nawzajem swoją terminologię i zaczęli mówić tym samym językiem. Jednym ze sposobów jest trenowanie zespołów. Łącząc naukowców i inżynierów w dwójki, możesz zachęcać do wspólnej nauki i przełamywać bariery. Dla naukowców danych oznacza to uczenie się wzorców kodowania, pisanie kodu w bardziej zorganizowany sposób, a co najważniejsze, zrozumienie stosu technologii i kompromisów infrastrukturalnych związanych z wprowadzeniem modelu do produkcji. Wysłany na 7wData.be