Extras din Data and Goliath: The Hidden Battles to Collect Your Data and Control Your World by Bruce Schneier. Copyright (c) 2015 by Bruce Schneier | via digg.com, traducere de Cuvântul Ortodox (s.m.)
În cel mai recent bestseller său, „Date și Goliat” (trad. n.), renumitul expert în securitate și scriitor Bruce Schneier pătrunde adânc în lumea supravegherii, investighează modul în care atât guvernele, cât și corporațiile monitorizează aproape fiecare mișcare a noastră. În acest fragment, Schneier explică maniera în care ni se livrează o narațiune falsă despre modul în care statul nostru care ne supraveghează este capabil de a opri atacurile teroriste înainte ca acestea să se întâmple. De fapt, așa cum susține Schneier, ideea că guvernul nostru este capabil de a analiza toate datele invazive și personale pe care le colectează de la noi este ridicolă. Extragerea de date efectuată în fiecare zi pare doar să preia resurse valoroase și timp ce ar putea fi dedicate studierii tacticilor care ar trebui să fie utilizate pentru a lupta împotriva terorismului.
NSA (Agenția națională de securitate a SUA) folosește în mod repetat metafora „unește punctele” pentru a justifica activitățile sale de supraveghere. Din nou și din nou – după 9/11, după „Underwear bomber”, după atentatele cu bombă de la maratonul din Boston – guvernele sunt criticate pentru că nu pot să „unească punctele”.
Cu toate acestea, este o metaforă teribil de înșelătoare. „Unirea punctelor” într-o carte de colorat este ușoară, pentru că toate punctele sunt numerotate și vizibile. În viața reală, punctele pot fi recunoscute numai post factum.
Asta nu ne oprește să cerem să știm de ce autoritățile nu au putut uni punctele. Semnele de avertizare lăsate de ucigașul de la Fort Hood, de atentatorii de la maratonul din Boston, sau de cel care a tras la Isla Vista par evidente în retrospectivă. Nassim Taleb, un expert în inginerie de risc, denumește această tendință „eroare narativă.”
Oamenii sunt povestitori nativi, iar lumea poveștilor este mult mai ordonată, mai previzibilă și mai coerentă decât realitatea. Milioane de oameni se comportă suficient de ciudat pentru a atrage atenția FBI, și aproape toți aceștia sunt inofensivi. Lista de interdicție aeriană a TSA are peste 20.000 de oameni pe ea. „Terrorist Identities Datamart Environment”, de asemenea cunoscută sub numele de „lista de observație”, are pe ea 680.000 de persoane, dintre care 40% „nu au nici o afiliere cunoscută la un grup terorist.”
Extragerea de date („data mining„) este prezentată drept tehnica care va permite „unirea punctelor”. Dar, în timp ce corporațiile extrag cu succes datele noastre personale pentru a direcționa publicitate, a detecta fraudele financiare și a efectua alte sarcini, trei aspecte esențiale fac extragerea de date un instrument nepotrivit pentru identificarea teroriștilor.
Primul și cel mai important aspect este rata de eroare. Pentru publicitate, extragerea de date poate fi considerată un succes chiar și cu o rată de eroare mare, dar găsirea teroriștilor necesită un grad mult mai mare de precizie decât pot oferi sistemele de extragere de date.
Extragerea de date funcționează cel mai bine atunci când sunteți în căutarea unui profil bine definit, atunci când există un număr rezonabil de evenimente pe an și în cazul în care costul unei alarme false este scăzut. Detectarea fraudelor cu card de credit este una dintre poveștile de succes în domeniul securității ale extragerii de date: toate companiile de carduri de credit caută în bazele lor de date de tranzacții tipare de cheltuieli care ar putea indica o cartelă furată. Există peste un miliard de carduri de credit active în circulație în Statele Unite, și aproape 8% din acestea sunt utilizate în mod fraudulos în fiecare an.
Multe furturi de carduri de credit urmează același tipar – achiziții în locații care nu sunt frecventate în mod normal de titularul cardului și achiziții de excursii, bunuri de lux și articole cu ușurință de identificat – și, în multe cazuri, sistemele de extragere de date pot minimiza pierderile prin prevenirea tranzacțiilor frauduloase. Singurul cost al unei alarme false este un apel telefonic către titularul cardului cerându-i să verifice câteva achiziții.
În mod similar, IRS utilizează „data mining” pentru identificarea evazioniștilor fiscali, poliția pentru a prezice punctele fierbinți de infracțiune, iar băncile pentru a prezice imposibilitățile de plată a împrumuturile. Aceste aplicații au avut succes datorită datelor și a aplicațiilor, dar sunt toate în interiorul a ceea ce extragerea datelor poate realiza.
Comploturile teroriste sunt diferite, în mare parte pentru că în timp ce frauda este des întâlnită, atacurile teroriste sunt foarte rare. Acest lucru înseamnă că sisteme chiar foarte precise de predicție a terorismului vor fi inundate cu alarme false și vor fi, astfel, inutile.
Motivul constă în matematica folosită la detecție. Toate sistemele de detectare au erori, iar proiectanții de sisteme le pot regla pentru a reduce la minimum fie estimările pozitive false, fie estimările negative false. Într-un sistem terorist de detectare, un „fals pozitiv” se produce atunci când sistemul identifică greșit ceva inofensiv ca o amenințare. Un „fals negativ” apare atunci când sistemul ratează un atac real. În funcție de modul în care este calibrat sistemul de detectare, puteți crește numărul de alarme false pentru a vă asigura că sunt mai puține riscuri de a rata un atac, sau puteți reduce numărul de alarme false, cu riscul de a rata atacuri.
Deoarece atacurile teroriste sunt atât de rare, „falsurile pozitive” copleșesc sistemul, indiferent de cât de bine ar fi calibrat. Și vreau să subliniez că ar fi complet blocat: milioane de oameni vor fi acuzați pe nedrept pentru fiecare complot terorist real găsit de sistem, în cazul în care ar identifica vreunul vreodată.
Am putea fi în măsură să facem față tuturor cazurilor de nevinovați marcați de sistem în cazul în care costul „falsurilor pozitive” ar fi fost minor. Gândiți-vă la scanerelor corporale în aeroporturi. Acelea în alertă tot timpul la scanarea oameni. Dar, un ofițer TSA poate vedea cu ușurință dacă e vorba de o alarmă falsă printr-o simplă verificare corporală. Această soluție nu funcționează pentru un sistem mai general bazat pe date de detectare a terorismului. Fiecare alertă necesită o investigație de lungă durată pentru a se stabili dacă este reală sau nu. Aceasta implică timp și de bani și împiedică ofițerii de informații de la a face alte munci productive. Sau, mai sugestiv spus, când te uiți la tot, nu vezi nimic.
Comunitatea de informații din SUA compară, de asemenea, găsirea unui complot terorist cu căutarea unui ac în carul cu fân. Și, așa cum a declarat fostul director al NSA, generalul Keith Alexander, „aveți nevoie de carul cu fân pentru a găsi acul.” Această afirmație ilustrează perfect care este problema cu supravegherea în masă și cu colectarea datelor în vrac. Când sunteți în căutarea acului, ultimul lucru pe care doriți să-l faceți este să mai puneți încă o grămadă de fân peste el.
Mai exact, nu există nici o justificare științifică pentru a crede că adăugarea de date irelevante despre oameni nevinovați face mai ușor de găsit un atac terorist, dar există o mulțime de dovezi împotrivă. S-ar putea să prindeți ceva mai bine semnalul, dar adăugați, de asemenea, mult mai mult bruiaj. Și, în ciuda gândirii NSA de a „colecta tot”, propriile lor documente atestă acest lucru. Comunitatea de informații militare chiar vorbește despre problema „băutului dintr-un furtun de pompieri”: având atât de multe date irelevante, este imposibil să găsești cei mai importanți biți.
Am văzut această problemă cu programul de interceptare al NSA: „falsurile pozitive” au copleșit sistemul. În anii de după 9/11, NSA a transmis către FBI mii de sesizări pe lună; fiecare dintre ele s-a dovedit a fi o alarmă falsă. Costul a fost enorm și a sfârșit prin a frustra agenții FBI, care au fost obligați să investigheze toate pistele. Am văzut de asemenea aceasta cu baza de date Suspicious Activity Reports – SAR: zeci de mii de rapoarte și nici un rezultat real. Și toate metadatele telefonice colectate de NSA au condus la un singur succes: condamnarea unui șofer de taxi care a trimis 8.500 de dolari la un grup somalez care nu reprezenta o amenințare directă pentru SUA – și care a fost, probabil, fals, astfel încât NSA să aibă ce să prezinte în fața Congresului.
A doua problemă cu folosirea tehnicilor de extragere de date pentru a încerca să se descopere comploturi teroriste este că fiecare atac este unic. Cine ar fi ghicit că două bombe din butelii vor fi livrate la linia de sosire a maratonului de la Boston în rucsaci de un copil de colegiu din Boston și de fratele lui mai mare? Fiecare individ separat care realizează un atac terorist va avea un impact disproporționat asupra criteriile utilizate pentru a decide cine e un terorist probabil, ceea ce duce la strategii de detectare ineficiente.
A treia problemă este că oamenii pe care NSA încearcă să-i găsească sunt vicleni și încearcă să evite detectarea. În lumea marketing-ului personalizat, subiectul tip al supravegherii nu încearcă să-și ascundă activitățile sale. Acest lucru nu este adevărat în context polițienesc sau de securitate națională. O relație de adversitate face problema mult mai grea și înseamnă că cele mai multe instrumente de analiză a datelor comerciale pur și simplu nu funcționează. Un instrument comercial poate ignora pur și simplu oameni care încearcă să se ascundă și prezumă un comportament benign din partea tuturor. Tehnicile guvernamentale de extragere de date nu pot face asta, pentru că aceștia sunt chiar oamenii pe care-i caută.
Adversarii variază în gradul de sofisticare al capacității lor de a evita supravegherea. Cei mai mulți criminali și teroriști – dar și disidenți politici, din păcate – sunt destul de neatenți și fac o mulțime de greșeli. Dar aceasta nu e nicio justificare pentru „data mining”; supravegherea selectivă ar putea să-i identifice la fel de bine. Întrebarea este dacă supravegherea în masă performează semnificativ mai bine decât supravegherea selectivă, pentru a justifica costurile extrem de ridicate. Mai multe analize ale tuturor eforturilor NSA indică faptul că nu.
Cele trei probleme enumerate mai sus nu pot fi surmontate. „Data mining” este pur și simplu instrumentul greșit, ceea ce înseamnă că toată supravegherea în masă necesară pentru a-l alimenta nu poate fi justificată. Când a fost director al NSA, generalul Keith Alexander a susținut că supravegherea omniprezentă ar fi permis NSA să prevină 9/11. Pare puțin probabil. El nu a fost în măsură să prevină atentatele cu bombă de la maratonul din Boston în 2013, chiar dacă unul dintre atentatori a fost pe lista suspecților de terorism și amândoi frații au lăsat suficiente urme pe „social media” – și aceasta după o duzină de ani de specializare post-9/11. NSA a colectat date cu privire la Tsarnaevs înainte de atentat, dar nu și-a dat seama că au fost mai importante decât datele pe care le colectaseră despre alte milioane de oameni.
Acest argument a fost susținut în Raportul Comisiei 9/11. Acest raport a descris eșecul de „a uni punctele”, pentru care susținătorii supravegherii în masă susțin că e nevoie să se colecteze mai multe date. Dar raportul a spus, în realitate, că toate informațiile despre complot au fost deținute de comunitatea de informații fără a fi nevoie de supravegherea în masă, iar eșecurile au fost rezultatul analizei inadecvate.
Supravegherea în masă nu l-a prins pe atentatorul Umar Farouk Abdulmutallab în 2006, deși chiar tatăl său a avertizat în mod repetat guvernul SUA că este periculos. Iar atentatorii cu lichid (aceștia sunt motivul pentru care guvernele interzic pasagerilor aducerea unor sticle mari de lichide, creme sau geluri la bordul avioanelor în bagaj lor de mână) au fost capturați în 2006, în apartamentul lor din Londra, nu din cauza supravegherii în masă, ci prin muncă tradițională de investigație a poliției. Ori de câte ori aflăm despre un succes al NSA, aceasta invariabil vine de la supraveghere orientată, mai degrabă decât de la supravegherea în masă. O analiză a arătat că FBI-ul identifică potențialele comploturi teroriste din rapoartele de activitate suspectă, rapoarte din teren, precum și din investigații ale altor infracțiuni independente.
Acesta este un punct esențial. Supravegherea omniprezentă și extragerea datelor nu sunt instrumente adecvate pentru identificarea criminalilor sau a teroriștilor. Noi, contribuabilii, irosim miliarde pe programele de supraveghere în masă și nu primim siguranța care ni s-a promis. Mai important, banii pe care îi pierdem pe aceste programe ineficiente de supraveghere sunt tot atâția bani care nu se cheltuiesc pe anchetă, analiza de securitate și răspuns de urgență: tactici care s-au dovedit eficiente. Eforturile de supraveghere ale NSA ne-au sporit, de fapt, nesiguranța.
Teroristii, unii inventati poate sunt tocmai motivele pentru impunerea supravegherii in masa prin inalta tehnologie care se afla astazi.Sa nu uitam ca practic se pot clona oameni, decat nu se da voie.Deci, va imaginati in ce lume traim?
Umbla dupa fantome inventate tot de ei.