Podaci su osjetljiva tema i prirodno ćete biti oko toga kao podatkovni znanstvenik. Evo nekih pravila kojih se uvijek trebate pridržavati.

Podaci su iznimno vrijedni, a njihovo korištenje lako je jedna od najboljih praksi za većinu današnjih organizacija. No poznavanje industrijskih standarda u vezi s tim neophodno je kako bi znanstvenici podataka ne griješili s podacima dok ljudi uče više o njihovoj vrijednosti.

Kao takvi, znanstvenici koji se bave podacima moraju prihvatiti sigurne i etičke prakse i usvojiti one standardizirane. Umjesto razmatranja koliko su podaci samo vrijedni, mudro je propitivati ​​metode dobivanja i obrade podataka za bilo koju svrhu. Stoga, evo devet kodeksa ponašanja koje bi svaki podatkovni znanstvenik trebao slijediti.

1. Pridržavajte se propisa

Znanstvenici koji se bave podacima moraju poznavati propise o zaštiti podataka koji se odnose na određene poslove. U suprotnom možete nesvjesno prekršiti zakon i dovesti sebe i druge u opasnost. Dakle, ovo znanje je ključno za osiguranje etičkog rada i sprječavanje nenamjerne štete.

instagram viewer

Kao takvi, provjerite relevantne zakone prije nego što se uključite u bilo kakve aktivnosti. Nadalje, nemojte samo poštovati propise da biste slijedili pravila; također tražiti njihovo dublje razumijevanje. Da biste pravilno poštovali propise, morate znati zašto su postavljeni i od čega štite.

Nekoliko važnih zakona o privatnosti su Opća uredba EU-a o zaštiti podataka (GDPR) i Kalifornijski zakon o privatnosti potrošača (CCPA). Ostali uključuju HIIPA, DPA, PIPEDA, LGPD i mnoge propise specifične za industriju.

2. Poštujte privatnost

Adrese, e-pošta i ID identifikatori su koji ne bi trebali biti javni jer predstavljaju stvarni rizik za ljude. Stoga osigurajte da su ti detalji što privatniji.

Ako budu izložene, žrtve bi mogle stradati od krađe identiteta ili prijevare. Također bi mogli biti ucijenjeni od strane ljudi prijeteći da će objaviti njihove povjerljive informacije. Nadalje, stručnjaci mogu pretrpjeti štetu po ugledu i internetsko uznemiravanje nakon što se njihove osobne preferencije objave. To može utjecati na njihove odnose, prilike za karijeru i društveni položaj.

Imajući to na umu, istražite i odaberite učinkovite načine za poboljšanje sigurne online identitete i deidentificirati podatke. Na primjer, možete zamijeniti znakove, ukloniti izravne identifikatore ili generalizirati. Na taj način štitite osjetljive podatke od kibernetičkih kriminalaca i istovremeno pomažete organizacijama s vašim otkrićima.

3. Uklonite pristranost

Znanstvenici koji se bave podacima oslanjaju se na statistiku kako bi bili što objektivniji. Ipak, unatoč ovim naporima, pristranost i dalje postoji jer je ideja da su veći podaci točniji jedna od najzastupljenijih uobičajeni mitovi o znanosti o podacima.

U tome postoji nešto istine, ali nažalost, veliki podaci ponekad sadrže nepotrebne ili lažne elemente i statistiku. Dakle, umjesto da se fokusirate samo na brojke, pobrinite se da vaši podaci budu čisti i reprezentativni.

Čišćenje ili filtriranje podataka prije upotrebe izvrsne su metode borbe protiv pristranosti. Na primjer, možete provjeriti pogreške ili upotrijebiti stratificirano uzorkovanje kako biste osigurali reprezentativne podatke.

4. Nemojte izmišljati ili izmišljati rezultate

Lažiranje je oblik zlouporabe podataka i prijevare u istraživanju koji uključuje izmišljanje nalaza i njihovo prijavljivanje kao istinitih.

Na primjer, podatkovni znanstvenik može izvijestiti da je utvrđeno da lijek nema nuspojava za većinu pripadnika određene dobne skupine. Ti bi nalazi bili izmišljeni da nije bilo početnih medicinskih eksperimenata i prikupljenih podataka koji bi ih poduprli.

Izmišljanje ima ozbiljne i negativne posljedice za znanstvenike podataka i one koji se oslanjaju na njihov rad. To bi moglo uništiti vašu vjerodostojnost, uprljati ugled vaše organizacije, naštetiti javnosti ili vas izložiti pravnim rizicima.

5. Nemojte krivotvoriti ili manipulirati dokazima

Falsificiranje je manipulacija stvarnošću, prikupljeni podaci za potrebe cilja. Dok proizvođači izmišljaju rezultate na temelju nepostojećih podataka kako bi poduprli svoje tvrdnje, krivotvoritelji rade na opovrgavanju stvarnih i postojećih podataka iz osobnih razloga. Kako bi to postigli, mogu dirati u istraživačku opremu, mijenjati ili potpuno izostaviti podatke.

Krivotvorenje može naštetiti javnosti pružanjem lažnih informacija koje utječu na donošenje odluka u različitim sektorima. Na primjer, krivotvorena studija o lijeku mogla bi izložiti ljude nepotrebnim rizicima, neučinkovitim tretmanima ili štetnim nuspojavama. Također može uzrokovati gubitak novca, vremena ili materijala koji su se mogli koristiti u druge svrhe.

Lažiranje i krivotvorenje su beskrupulozne prakse sa štetnim učincima i brojnim sankcijama. To može uključivati ​​novčane kazne, opoziv vjerodajnica, gubitak financiranja istraživanja ili zatvor.

6. Prikaži transparentnost

Transparentnost za podatkovne znanstvenike znači biti pošten u pogledu metoda koje se primjenjuju za prikupljanje, analizu i predstavljanje podataka. Znanstvenici koji se bave podacima trebali bi biti otvoreni i spremni dijeliti svoje prakse s drugim znanstvenicima koji se bave podacima i sudionicima studija.

Štoviše, morate dobiti pristanak sudionika studije jer objavljivanje rezultata bez informiranog pristanka može nepoštivati ​​ili naštetiti sudionicima na razne načine. Mogu povrijediti njihovo dostojanstvo, privatnost i autonomiju ili ih izložiti štetnim, nepotrebnim rizicima koji proizlaze iz studije.

Transparentnost gradi povjerenje kod onih koji se oslanjaju na vaše podatke za uvid. Također osigurava kvalitetu podataka dopuštajući drugima da pregledaju vaše rezultate.

Osim toga, otvorenost među znanstvenicima podataka potiče suradnju i učenje. Možete pomoći u poticanju inovacija dijeljenjem svog procesa i komuniciranjem najbolje metode vizualizacije podataka i tehnike znanosti o podacima vršnjacima dok uče od njih.

7. Prikupite podatke na siguran način

Znanstvenici koji se bave podacima moraju potvrditi sigurnost metoda koje se koriste za prikupljanje, analizu i pohranu podataka. Time se sprječavaju moguće povrede podataka koje mogu utjecati na znanstvenike koji se bave podacima i sudionike istraživanja.

Povrede podataka ugrožavaju osobnu sigurnost, potkopavaju povjerenje javnosti i razotkrivaju organizacijsku nesposobnost što rezultira nevjerojatnim financijskim gubicima za tvrtku. Ti gubici mogu biti tužbe od strane žrtava povrede podataka, manje klijenata i više.

U svjetlu ovoga, morate provesti istraživanje kako biste pronašli najučinkovitija rješenja za sigurnost podataka i primijeniti ih. Na primjer, možete osigurati veze TLS/SSL enkripcijom ili koristiti rotirajuće proxyje. Također, možete primijeniti mjere kontrole pristupa i stvoriti sigurnosne kopije u slučaju napada. Kada pronađete rješenja, ne zaboravite ih podijeliti s drugima kako biste osigurali maksimalnu sigurnost.

8. Koristite algoritme odgovorno

Algoritmi nisu samo alati za analizu podataka. Oni snažno utječu na ljudske živote, ponašanja i prilike. Međutim, iako pomažu u rješavanju problema i daju inovativna predviđanja, oni su također nesavršeni.

Ako nisu pažljivo dizajnirani, testirani ili implementirani, algoritmi imaju društvene i etičke učinke koji mogu naštetiti određenim skupinama ljudi. Oni također unose pristranost ako se obučavaju na podacima koji odražavaju postojeće predrasude i mogu biti nepredvidivi. Stoga ih znanstvenici koji se bave podacima moraju dizajnirati i koristiti odgovorno.

Uvijek odaberite odgovarajuće algoritme, testirajte njihovu izvedbu i objasnite kako rade. Također, osigurajte da identificirate potencijalne izvore pristranosti i implementirate mehanizme koji ažuriraju ili ispravljaju gdje je to potrebno.

9. Razmotrite dugoročne implikacije svog rada

Vaš rad kao podatkovnog znanstvenika značajno će utjecati na mnoge aspekte društva. Dakle, uvijek razmislite o tome kako vaši modeli utječu na ljude.

Na primjer, pokušajte se zapitati može li vaš rad ovjekovječiti predrasude i nejednakost ili ugroziti privatnost u budućnosti. Zatim, adekvatno riješite te probleme.

Imajte na umu da je pogled usmjeren na budućnost važniji od bilo koje korektivne metode, a razmišljanje o danima koji dolaze jedan je od najučinkovitijih načina za donošenje etički zdravih odluka.

Morate biti etični kao podatkovni znanstvenik

Kao podatkovni znanstvenik dobivate moć koja dolazi s proporcionalnom odgovornošću. Vaše su vještine rijetke, pa sjedite na čelu organizacijskih odluka.

Vaše odluke utječu na sve, od poslovnih planova tvrtke do kaznenopravnih sustava. Dakle, ne biste ih trebali olako izrađivati. Uvijek budite pošteni, etični i pedantni u svom radu kako biste zaštitili ljude od postojećih etičkih dilema u vašoj industriji i drugim tehnološkim područjima.