Wykrywanie nienaturalnych prawidłowości w danych na dużą skalę
Nasze podejście polega na matematycznym modelowaniu jak największej liczby różnych rodzajów zachowań online, przy użyciu jak największej liczby różnych technik, tak aby skonstruować jak najbardziej wielowymiarowy model. Takie podejście uwzględnia rzeczywistość, w której wyrafinowani przeciwnicy mogą często zmieniać wiele aspektów swojego zachowania, aby uniknąć wykrycia, ale nie mogą zmieniać ich wszystkich przez cały czas.
Chociaż korzystamy z uczenia maszynowego (ML), gdy jest to właściwe, nie nadużywamy go. Na przykład ML nie nadaje się do zastosowania w sytuacji, w której tylko niewielka ilość danych jest dostępna. W takiej sytuacji preferujemy zbadać problem w terenie, z wielu różnych punktów widzenia i dopiero wtedy określać jego najlepsze matematyczne wyrażenie. W tym celu wykorzystujemy między innymi:
Hipergrafy
Różne rodzaje krat / Teorię krat
Teorię snopów i teorię kategorii
Wykresy homologii / kohomologii
Często opracowujemy własne algorytmy, aby jak najlepiej wykrywać interesujące nas zjawiska.
Wśród najważniejszych cech naszego systemu jest możliwość pozyskania dowodów koordynacji między różnymi, pozornie niepowiązanymi tożsamościami. Sama obecność takiej koordynacji bezpośrednio implikuje coś, co nie jest uczciwe i przejrzyste. Co najważniejsze, jest to obiektywna miara, która ma zastosowanie wszędzie. Nasza technologia została sprawdzona w różnych kontekstach, od wykrywania członkostwa w brutalnych gangach ulicznych w Detroit po duże korporacje publikujące pozytywne, ale fałszywe recenzje „pracowników” na stronach internetowych poświęconych karierze.
Nasz model pozwala uniknąć coraz bardziej podstępnej pułapki próby rozstrzygnięcia co jest prawdą. Zamiast tego koncentruje się na uchwyceniu całkowicie obiektywnych, sztucznie wytworzonych aspektów zachowań online, takich jak wzorce koordynacji między kontami, podejrzany czas publikacji, powtórzenia niezwykle spójnych dialogów, nietypowo skonstruowane struktury sieci społecznościowych i tak dalej. W ten sposób nasze analizy pozostają wolne od politycznych lub innych uprzedzeń, które nieuchronnie pojawiają się w wyniku dodawania przez ludzi etykiet lub oznaczeń do przykładów służących w procesie uczenia maszynowego. Dotyczy to również korzystania z wiedzy i umiejętności grupy ludzi za pośrednictwem Internetu (crowd-sourcing).
This website uses cookies to improve your experience. We'll assume you accept this policy as long as you are using this websiteAcceptView Policy