Catapultam habeo. Nisi pecuniam omnem mihi dabis, ad caput tuum saxum immane mittam.

Nie rozumiem czyli metoda Copy’ego-Paste’a + bezmyślność

Posted in it, tekst by maciejewski on 29 listopada, 2010, 21:01

W trzecim kwartale bieżącego roku zanotowano duży spadek liczby spamu. W październiku, w porównaniu z sierpniem, liczba niechcianych e-maili zmniejszyła się aż o 47 procent. Mimo tak znacznego spadku spam stanowi 82,3% wszystkich listów elektronicznych. Kwartał wcześnie było to 84,4%

źródło: Locos.pl („Kwartał wcześnie było to” – pisownia oryginalna)

Po pierwsze: październik to pierwszy miesiąc czwartego kwartału więc – po drugie – jeśli tak ogromny spadek miał miejsce w trzecim kwartale to jak możliwy jest kolejny spadek o 47% w październiku oraz fakt, że po jednym (lub dwóch, w trzecim kwartale oraz w pierwszym miesiącu czwartego) takim spadku i tak spam stanowi 82% wszystkich maili?

Przy bardzo odważnym założeniu (przy tej ilości danych lepiej się chyba nie da), że wartości w trzech miesiącach kwartału rozkładają się równomiernie po 1/3 to spadek odsetku spamu o 47% (dajmy dla ułatwienia 50%) w jednym miesiącu czyli z 84% do 42% powinien dać nam (84/100+84/100+(84*(1-0,47))/100)/3 = 70% średniego odsetku w kwartale. Acz to tylko dywagacje.

Przechodząc do sedna: jak można zmienić jedną wartość o 50% tak by wartość końcowa porównania dwóch pozostała bez zmian?  x1/x1+y1 = x2/x2+y2 i równocześnie x1/x2 = 1/2? Odpowiedź jest prosta: Należy analogicznie zmienić drugą wartość i mamy gotowe: 1/11 = 2/22. Wilk syty i owca w ciąży cała

Nie wydaje mi się jednak, żeby w ciągu kwartału ogólna ilość maili zmieniła się tak bardzo. Tym razem jednak pod tekstem (nota bene umieszczonym w dziale „publikacje”, autor Piotr Błaszczeć) znajdziemy informację: [źródło: www.arcabit.pl] Po kliknięciu na link oczom naszym ukazuje się dokładnie ten sam tekst. Czy publikacja polega na przeklejeniu artykułu znalezionego na innym serwisie? Chyba, że ten sam autor pisze dla obu serwisów, nie wiem, na Arcabit nie podano autora, ale jest za to link: źródło: SC Magazine. Pod wskazanym adresem znajdziemy trzy serwisy UK, USA i Australia, na wszystkich trzech poszukałem tekstu, który mógłby być źródłem informacji dla autora. Pierwszy na jaki natrafiłem po wpisaniu frazy „spam october” w wyszukiwarce wprawił mnie w osłupienie:

As a result, according to Symantec’s MessageLabs Intelligence Report for October, the global ratio of spam in email traffic fell 4.2 percent to 87.5 percent.

źródło: SC Magazine. Dość druzgocąca różnica w obliczeniach, ale być może porównywano inne okresy.

Natomiast tekst, który – jak mniemam – posłużył do napisania tego na Arcabit, gdyż tekst jest właściwie ten sam (tylko w oryginale jest dłuższy, czyżby nie chciało się całego przetłumaczyć?) znalazłem na australijskiej stronie serwisu pod tym adresem z adnotacją: This article originally appeared at itpro.co.uk, tym razem przynajmniej autor ten sam. Jak widać polska wersja to tylko tłumaczenie angielskiej co nie przeszkodziło „autorowi” w podpisaniu tekstu swoim nazwiskiem, nie wiem czy to taki teraz standard. Brnąc dalej w tekst znalazłem dwa kolejne tropy w postaci linków do serwisów źródłowych:

Both Symantec and Kaspersky have noted the spam decline, with the former finding October volumes went down 47 per cent when compared to August.

Kaspersky figures showed a decline in the third quarter when compared to the previous period, with the level of spam out of all detected messages recorded at 82.3 per cent, down from 84.4 per cent.

Udałem się więc na stronę Kaspersky Lab i w wyszukiwarce znalazłem tekst: October sees dramatic reduction in spam from the USA

According to Kaspersky Lab’s October spam report, the amount of spam in mail traffic decreased by 3.7 percentage points and averaged 77.4% for the month.

Tutaj mowa o spadku o zaledwie 3,7 punktu procentowego. Należy zwrócić uwagę właśnie na fakt, że po raz pierwszy użyto określenia punktu procentowego co świadczyłoby o znajomości fundamentalnych zagadnień statystyki (wzrost 10% wartości o 10% daje wynik 11%, wzrost 10% wartości o 10 punktów procentowych daje 20% wynik, tak na marginesie). Jednak jak wyczytać możemy w tytule tekstu raport dotyczy USA. Koniec końca udałem się na stronę główną Kaspersky Labs w poszukiwaniu raportów. Jak się szybko dowiedziałem dane takie publikowane są na serwisie SecureList (firmowanym zresztą przez logo Kaspersky) i tam znalazłem szczegółowy raport, w który jestem w stanie uwierzyć:

The amount of spam in email traffic fell by 3.7 percentage points compared to September’s figure and averaged 77.4%.

Skąd się nagle 3,7 „procent”  zamieniło w 47 ? Pewnie nigdy nie dowiemy się co brał autor analizy raportu, mnie natomiast irytuje poziom polskiego dziennikarstwa internetowego. Wszędzie widać tylko kopiowane artykuły innych serwisów, czasem ktoś pokusi się o tłumaczenie zagranicznego (lepsze lub gorsze, zazwyczaj to drugie). Liczy się tylko żeby tytuł był krzykliwy, licznik wizyt podskoczył i sponsor zapłacił za wyświetlone reklamy. Kilka miesięcy temu, kiedy Rupert Murdoch ogłosił że zamierza stworzyć internetową gazetę, za której czytanie będzie się płacić byłem przekonany, że w morzu darmowych serwisów taki pomysł na pewno na siebie nie zarobi, teraz jednak byłbym w stanie zapłacić kilka zł miesięcznie (jeśli metoda płatności będzie sensownie skonstruowana) za rzetelne i profesjonalne podejście do tematu dziennikarstwa w internecie.

Komentarze 2

Subscribe to comments with RSS.

  1. RafałC said, on 30 listopada, 2010, 10:04 at 10:04 am

    Trochę mi to przypomina I pracownię fizyczną, gdzie jednym z podstawowych działań była ocena czy uzyskany wynik jest prawdopodobny i pasuje do czegokolwiek co już wiemy. A wahania wartości przyśpieszenia ziemskiego w tym pomieszczeniu były dość znaczne, rzekłbym, że o rząd wielkości 😛

  2. DalajLama said, on 13 stycznia, 2011, 01:20 at 1:20 am

    Mnie natomiast irytuje poziom polskiego dziennikarstwa internetowego. Wszędzie widać tylko kopiowane artykuły.

    Kilka miesięcy temu, kiedy Rupert Murdoch ogłosił że zamierza stworzyć internetową gazetę, za której czytanie będzie się płacić byłem przekonany, że w morzu darmowych serwisów taki pomysł na pewno na siebie nie zarobi, teraz jednak byłbym w stanie zapłacić kilka zł miesięcznie (jeśli metoda płatności będzie sensownie skonstruowana) za rzetelne i profesjonalne podejście do tematu dziennikarstwa w internecie.

    Dalaj Lama 🙂


Dodaj komentarz