Pierwsze próby określania unikatowych cech stylu pisarskiego sięgają jeszcze XIX w. Polegały one na pracochłonnym obliczaniu częstotliwości występowania w tekście wszystkich par liter (ab, ac, ba, bc... itd.), które miały stanowić wzorzec stylu pisarskiego autora. Owe wzorce obliczano na podstawie dzieł konkretnych twórców. Następnie brano utwory o wątpliwym autorstwie i wykonywano analogiczne obliczenia. Kolejnym krokiem było porównanie wyliczonych wzorców obu tekstów. Gdy różnica była dostatecznie mała, przyjmowano, że autorem analizowanych materiałów jest ta sama osoba. Inne sposoby znajdowania "DNA stylu pisarskiego" zostały opracowane w drugiej dekadzie ubiegłego wieku przez dwóch Rosjan: Nikołaja Morozowa oraz Andrieja Markowa. Dzięki stworzonej przez nich metodzie statystycznej analizy języka udało się potwierdzić autorstwo jednego z największych dzieł romantyzmu - "Eugeniusza Oniegina" Aleksandra Puszkina. Przełom w stosowaniu żmudnych metod analizy statystycznej tekstów przyniosły komputery. Dzięki ich ogromnej mocy obliczeniowej i szybkości działania zaczęto stosować jeszcze bardziej wyrafinowane metody - m.in. oceniać gramatykę, długość zdań i wyrazów oraz częstotliwość występowania charakterystycznych słów i zwrotów. Użyto je z powodzeniem do porównań twórczości dwóch dziewiętnastowiecznych pisarzy - Charlesa Dickensa i Lewisa Carrolla. Identyfikując dzieła tych autorów komputer nie pomylił się ani razu! Komputerowa analiza tekstu to nie tylko szansa na wskazanie jego autora, to także wiarygodne narzędzie do oceny jakości, np. czytelności i zrozumiałości. Maszyny robią to badając cztery najistotniejsze czynniki: średnią liczbę wyrazów w zdaniu, liczbę zdań w tekście, średnią długość zdania oraz liczbę słów znajdujących się wśród tysiąca najbardziej powszechnych w danym języku. Działający na tej zasadzie program komputerowy Oc_Fo wykorzystano w Polsce w warszawskiej Akademii Pedagogiki Specjalnej do oceny zrozumiałości tekstów w materiałach dydaktycznych. Okazało się, że średnia ocen klarowności tekstów wystawionych przez ludzi i komputer była identyczna do drugiego miejsca po przecinku! Co więcej, autorzy tekstów nanieśli nawet sugerowane przez maszynę poprawki. Narzędzia komputerowej identyfikacji autorstwa stosuje się także do dzieł malarskich. Takie prace prowadzono m.in. w holenderskim University of Maastricht, analizując postacie z obrazów Vincenta van Gogha - komputer badał m.in. kontrast kolorów, strukturę nakładania farb oraz ślady pędzla. Dzięki temu potrafił nie tylko zweryfikować autentyczność dzieła, ale także uzasadnić swoją decyzję. Podobny program opracował kilka lat temu zespół z University of Bremen's Center for Computing Technologies, który nauczył komputer rozpoznawać dzieła Eugene'a Delacroix.