Data is een gevoelig onderwerp, en je zult er als datawetenschapper natuurlijk veel mee te maken hebben. Hier zijn enkele regels die u altijd moet volgen.
Gegevens zijn buitengewoon waardevol en het benutten ervan is tegenwoordig gemakkelijk een van de best practices voor de meeste organisaties. Maar kennis van de industriestandaarden hierover is noodzakelijk voor datawetenschappers om geen fouten te maken met data naarmate mensen meer te weten komen over de waarde ervan.
Als zodanig moeten datawetenschappers veilige en ethische praktijken omarmen en gestandaardiseerde gebruiken. In plaats van alleen te overwegen hoe waardevol de gegevens zijn, is het verstandig om vraagtekens te zetten bij de methoden voor het verkrijgen en verwerken van gegevens voor welk doel dan ook. Daarom zijn hier negen gedragscodes die elke datawetenschapper zou moeten volgen.
1. Reglementen in acht nemen
Datawetenschappers moeten de regels voor gegevensbescherming kennen die van toepassing zijn op bepaalde functies. Anders kunt u onbewust de wet overtreden en uzelf en anderen in gevaar brengen. Deze kennis is dus cruciaal om ethisch werk te waarborgen en onbedoelde schade te voorkomen.
Controleer daarom de relevante wetten voordat u activiteiten onderneemt. Houd je bovendien niet alleen aan voorschriften om de regels te volgen; zoek ook een dieper begrip van hen. Om regels goed na te leven, moet u weten waarom ze zijn geplaatst en waartegen ze beschermen.
Een paar opmerkelijke privacywetten zijn de Algemene Verordening Gegevensbescherming van de EU (AVG) en de California Consumer Privacy Act (CCPA). Andere zijn HIIPA, DPA, PIPEDA, LGPD en vele branchespecifieke voorschriften.
2. Respecteer privacy
Adressen, e-mails en ID's zijn identificatoren die niet openbaar mogen zijn, omdat ze reële risico's voor de mensen vormen. Zorg er daarom voor dat u deze gegevens zo privé mogelijk maakt.
Als ze worden blootgesteld, kunnen slachtoffers slachtoffer worden van identiteitsdiefstal of fraude. Ze kunnen ook worden gechanteerd door mensen die dreigen hun vertrouwelijke informatie vrij te geven. Bovendien kunnen professionals reputatieschade en online intimidatie oplopen zodra hun persoonlijke voorkeuren openbaar worden gemaakt. Deze kunnen van invloed zijn op hun relaties, carrièremogelijkheden en sociale status.
Dus met dat in gedachten, onderzoek en selecteer effectieve manieren om beter te worden veilige online identiteiten en de-identificeer gegevens. U kunt bijvoorbeeld tekens vervangen, directe identificaties verwijderen of generaliseren. Door dit te doen, worden gevoelige gegevens beschermd tegen cybercriminelen en worden organisaties geholpen met uw bevindingen.
3. Elimineer vooringenomenheid
Datawetenschappers vertrouwen op statistieken om zo objectief mogelijk te zijn. Maar ondanks deze inspanningen blijft de vooringenomenheid bestaan, omdat het idee dat grotere gegevens nauwkeuriger zijn een van de meest is veelvoorkomende mythen over datawetenschap.
Hier zit enige waarheid in, maar helaas bevatten grote gegevens soms onnodige of nep-elementen en statistieken. Zorg er dus voor dat uw gegevens schoon en representatief zijn in plaats van u alleen op de cijfers te concentreren.
Het opschonen of filteren van gegevens voor gebruik zijn uitstekende methoden om vooringenomenheid tegen te gaan. U kunt bijvoorbeeld controleren op fouten of gestratificeerde steekproeven gebruiken om representatieve gegevens te garanderen.
4. Fabriceer of verzin geen resultaten
Fabricage is een vorm van gegevensmisbruik en onderzoeksfraude waarbij bevindingen worden verzonnen en als waar worden gerapporteerd.
Een datawetenschapper kan bijvoorbeeld melden dat een medicijn geen bijwerkingen heeft voor de meeste leden van een bepaalde leeftijdsgroep. Deze bevindingen zouden verzonnen zijn als er geen eerste medische experimenten en verzamelde gegevens waren om ze te ondersteunen.
Fabricage heeft ernstige en negatieve gevolgen voor datawetenschappers en degenen die op hun werk vertrouwen. Het kan uw geloofwaardigheid aantasten, de reputatie van uw organisatie aantasten, het publiek schade berokkenen of u blootstellen aan juridische risico's.
5. Vervals of manipuleer geen bewijsmateriaal
Vervalsing is het manipuleren van de werkelijkheid, verzamelde gegevens om aan een agenda te voldoen. Terwijl fabrikanten resultaten verzinnen van niet-bestaande gegevens om hun beweringen te ondersteunen, werken vervalsers om echte en bestaande gegevens om persoonlijke redenen te weerleggen. Om dit te bereiken, kunnen ze knoeien met onderzoeksapparatuur, gegevens wijzigen of helemaal weglaten.
Vervalsing kan het publiek schade berokkenen door onjuiste informatie te verstrekken die de besluitvorming in verschillende sectoren beïnvloedt. Een vervalst medicijnonderzoek kan mensen bijvoorbeeld blootstellen aan onnodige risico's, ineffectieve behandelingen of schadelijke bijwerkingen. Het kan ook het verlies van geld, tijd of materialen veroorzaken die voor andere doeleinden hadden kunnen worden gebruikt.
Fabricage en vervalsing zijn gewetenloze praktijken met nadelige gevolgen en talloze sancties. Dit kunnen boetes, intrekking van inloggegevens, verlies van onderzoeksfinanciering of opsluiting zijn.
6. Toon transparantie
Transparantie voor datawetenschappers betekent eerlijk zijn over de methoden die worden toegepast om gegevens te verzamelen, analyseren en presenteren. Datawetenschappers moeten open zijn en bereid zijn om hun praktijken te delen met andere datawetenschappers en studiedeelnemers.
Bovendien moet u de toestemming van de studiedeelnemers verkrijgen, omdat het publiceren van resultaten zonder geïnformeerde toestemming de deelnemers op verschillende manieren niet respecteert of schade berokkent. Ze kunnen hun waardigheid, privacy en autonomie schenden of hen blootstellen aan schadelijke, onnodige risico's die voortvloeien uit het onderzoek.
Transparantie bouwt vertrouwen op bij degenen die voor inzicht op uw gegevens vertrouwen. Het zorgt ook voor gegevenskwaliteit door anderen uw resultaten te laten beoordelen.
Bovendien bevordert openheid onder datawetenschappers samenwerking en leren. U kunt helpen om innovatie te bevorderen door uw proces te delen en te communiceren beste methoden voor gegevensvisualisatie en data science-technieken aan collega's terwijl u van hen leert.
7. Verzamel gegevens veilig
Datawetenschappers moeten de veiligheid bevestigen van de methoden die worden gebruikt om gegevens te verzamelen, analyseren en opslaan. Dit voorkomt mogelijke datalekken die de datawetenschappers en studiedeelnemers kunnen treffen.
Datalekken brengen de persoonlijke veiligheid in gevaar, ondermijnen het vertrouwen van het publiek en leggen de incompetentie van de organisatie bloot, wat leidt tot duizelingwekkende financiële verliezen voor het bedrijf. Deze verliezen kunnen rechtszaken zijn van de slachtoffers van datalekken, minder klanten en meer.
In het licht hiervan moet u onderzoek doen om de meest effectieve oplossingen voor gegevensbeveiliging en pas ze toe. U kunt bijvoorbeeld verbindingen beveiligen met TLS/SSL-codering of roterende proxy's gebruiken. Ook kunt u toegangscontrolemaatregelen afdwingen en back-ups maken in geval van een aanval. Als u oplossingen vindt, vergeet dan niet om deze met anderen te delen om maximale veiligheid te garanderen.
8. Gebruik algoritmen verantwoord
Algoritmen zijn niet alleen hulpmiddelen voor data-analyse. Het zijn krachtige invloeden op het leven, het gedrag en de kansen van mensen. Hoewel ze helpen bij het oplossen van problemen en het maken van innovatieve voorspellingen, zijn ze ook onvolmaakt.
Als algoritmen niet zorgvuldig worden ontworpen, getest of ingezet, hebben ze sociale en ethische gevolgen die bepaalde groepen mensen kunnen schaden. Ze introduceren ook vooringenomenheid als ze worden getraind op gegevens die bestaande vooroordelen weerspiegelen en onvoorspelbaar kunnen zijn. Datawetenschappers moeten ze dus op verantwoorde wijze ontwerpen en gebruiken.
Kies altijd geschikte algoritmen, test hun prestaties en leg uit hoe ze werken. Zorg er ook voor dat u potentiële bronnen van vooringenomenheid identificeert en mechanismen implementeert die waar nodig worden bijgewerkt of gecorrigeerd.
9. Overweeg de langetermijnimplicaties van uw werk
Je werk als datawetenschapper zal veel aspecten van de samenleving aanzienlijk beïnvloeden. Bedenk dus altijd hoe uw modellen mensen beïnvloeden.
Probeer je bijvoorbeeld af te vragen of je werk in de toekomst vooroordelen en ongelijkheid kan bestendigen of de privacy in gevaar kan brengen. Pak deze zorgen vervolgens adequaat aan.
Merk op dat een toekomstgerichte kijk belangrijker is dan welke corrigerende methode dan ook, en nadenken over de komende dagen is een van de meest effectieve manieren om ethisch verantwoorde beslissingen te nemen.
Je moet ethisch zijn als datawetenschapper
Als data scientist krijg je een bevoegdheid die gepaard gaat met proportionele verantwoordelijkheid. Je vaardigheden zijn zeldzaam, dus je zit in de voorhoede van de besluitvorming van de organisatie.
Uw beslissingen hebben invloed op alles, van bedrijfsplannen tot strafrechtsystemen. Je moet ze dus niet lichtvaardig maken. Wees altijd eerlijk, ethisch en nauwgezet in uw werk om mensen te beschermen tegen bestaande ethische dilemma's in uw branche en andere technische gebieden.