Catapultam habeo. Nisi pecuniam omnem mihi dabis, ad caput tuum saxum immane mittam.

Nie rozumiem czyli metoda Copy’ego-Paste’a + bezmyślność c.d.

Posted in tekst by maciejewski on Styczeń 15, 2011, 02:05

Znalazłem ostatnio ten sam artykuł na dwóch portalach Nextmag.pl i Pcformat.pl, podpisany dwoma różnymi nazwiskami:
Autor: Krzysztof Gudowski
Autor: Krzysztof Kozłowski

Gdyby chociaż ten artykuł był ciekawy czy wnosił cokolwiek nowego, ale nie. Klasycze pitu pitu byle ktoś kliknął i reklamodawca wypłacił dolę za reklamę a tekst może być bzdurny. Polskie dziennikarstwo internetowe schodzi (zeszło) na psy. Z całym szacunkiem dla tych mądrych i wiernych zwierząt.

Nie rozumiem czyli metoda Copy’ego-Paste’a + bezmyślność

Posted in it, tekst by maciejewski on Listopad 29, 2010, 21:01

W trzecim kwartale bieżącego roku zanotowano duży spadek liczby spamu. W październiku, w porównaniu z sierpniem, liczba niechcianych e-maili zmniejszyła się aż o 47 procent. Mimo tak znacznego spadku spam stanowi 82,3% wszystkich listów elektronicznych. Kwartał wcześnie było to 84,4%

źródło: Locos.pl („Kwartał wcześnie było to” – pisownia oryginalna)

Po pierwsze: październik to pierwszy miesiąc czwartego kwartału więc – po drugie – jeśli tak ogromny spadek miał miejsce w trzecim kwartale to jak możliwy jest kolejny spadek o 47% w październiku oraz fakt, że po jednym (lub dwóch, w trzecim kwartale oraz w pierwszym miesiącu czwartego) takim spadku i tak spam stanowi 82% wszystkich maili?

Przy bardzo odważnym założeniu (przy tej ilości danych lepiej się chyba nie da), że wartości w trzech miesiącach kwartału rozkładają się równomiernie po 1/3 to spadek odsetku spamu o 47% (dajmy dla ułatwienia 50%) w jednym miesiącu czyli z 84% do 42% powinien dać nam (84/100+84/100+(84*(1-0,47))/100)/3 = 70% średniego odsetku w kwartale. Acz to tylko dywagacje.

Przechodząc do sedna: jak można zmienić jedną wartość o 50% tak by wartość końcowa porównania dwóch pozostała bez zmian?  x1/x1+y1 = x2/x2+y2 i równocześnie x1/x2 = 1/2? Odpowiedź jest prosta: Należy analogicznie zmienić drugą wartość i mamy gotowe: 1/11 = 2/22. Wilk syty i owca w ciąży cała

Nie wydaje mi się jednak, żeby w ciągu kwartału ogólna ilość maili zmieniła się tak bardzo. Tym razem jednak pod tekstem (nota bene umieszczonym w dziale „publikacje”, autor Piotr Błaszczeć) znajdziemy informację: [źródło: www.arcabit.pl] Po kliknięciu na link oczom naszym ukazuje się dokładnie ten sam tekst. Czy publikacja polega na przeklejeniu artykułu znalezionego na innym serwisie? Chyba, że ten sam autor pisze dla obu serwisów, nie wiem, na Arcabit nie podano autora, ale jest za to link: źródło: SC Magazine. Pod wskazanym adresem znajdziemy trzy serwisy UK, USA i Australia, na wszystkich trzech poszukałem tekstu, który mógłby być źródłem informacji dla autora. Pierwszy na jaki natrafiłem po wpisaniu frazy „spam october” w wyszukiwarce wprawił mnie w osłupienie:

As a result, according to Symantec’s MessageLabs Intelligence Report for October, the global ratio of spam in email traffic fell 4.2 percent to 87.5 percent.

źródło: SC Magazine. Dość druzgocąca różnica w obliczeniach, ale być może porównywano inne okresy.

Natomiast tekst, który – jak mniemam – posłużył do napisania tego na Arcabit, gdyż tekst jest właściwie ten sam (tylko w oryginale jest dłuższy, czyżby nie chciało się całego przetłumaczyć?) znalazłem na australijskiej stronie serwisu pod tym adresem z adnotacją: This article originally appeared at itpro.co.uk, tym razem przynajmniej autor ten sam. Jak widać polska wersja to tylko tłumaczenie angielskiej co nie przeszkodziło „autorowi” w podpisaniu tekstu swoim nazwiskiem, nie wiem czy to taki teraz standard. Brnąc dalej w tekst znalazłem dwa kolejne tropy w postaci linków do serwisów źródłowych:

Both Symantec and Kaspersky have noted the spam decline, with the former finding October volumes went down 47 per cent when compared to August.

Kaspersky figures showed a decline in the third quarter when compared to the previous period, with the level of spam out of all detected messages recorded at 82.3 per cent, down from 84.4 per cent.

Udałem się więc na stronę Kaspersky Lab i w wyszukiwarce znalazłem tekst: October sees dramatic reduction in spam from the USA

According to Kaspersky Lab’s October spam report, the amount of spam in mail traffic decreased by 3.7 percentage points and averaged 77.4% for the month.

Tutaj mowa o spadku o zaledwie 3,7 punktu procentowego. Należy zwrócić uwagę właśnie na fakt, że po raz pierwszy użyto określenia punktu procentowego co świadczyłoby o znajomości fundamentalnych zagadnień statystyki (wzrost 10% wartości o 10% daje wynik 11%, wzrost 10% wartości o 10 punktów procentowych daje 20% wynik, tak na marginesie). Jednak jak wyczytać możemy w tytule tekstu raport dotyczy USA. Koniec końca udałem się na stronę główną Kaspersky Labs w poszukiwaniu raportów. Jak się szybko dowiedziałem dane takie publikowane są na serwisie SecureList (firmowanym zresztą przez logo Kaspersky) i tam znalazłem szczegółowy raport, w który jestem w stanie uwierzyć:

The amount of spam in email traffic fell by 3.7 percentage points compared to September’s figure and averaged 77.4%.

Skąd się nagle 3,7 „procent”  zamieniło w 47 ? Pewnie nigdy nie dowiemy się co brał autor analizy raportu, mnie natomiast irytuje poziom polskiego dziennikarstwa internetowego. Wszędzie widać tylko kopiowane artykuły innych serwisów, czasem ktoś pokusi się o tłumaczenie zagranicznego (lepsze lub gorsze, zazwyczaj to drugie). Liczy się tylko żeby tytuł był krzykliwy, licznik wizyt podskoczył i sponsor zapłacił za wyświetlone reklamy. Kilka miesięcy temu, kiedy Rupert Murdoch ogłosił że zamierza stworzyć internetową gazetę, za której czytanie będzie się płacić byłem przekonany, że w morzu darmowych serwisów taki pomysł na pewno na siebie nie zarobi, teraz jednak byłbym w stanie zapłacić kilka zł miesięcznie (jeśli metoda płatności będzie sensownie skonstruowana) za rzetelne i profesjonalne podejście do tematu dziennikarstwa w internecie.

Czy aby na pewno?

Posted in it, refleksje, tekst by maciejewski on Listopad 27, 2010, 22:00

Rozbawił mnie nieco wpis na jednym z niby-informatycznych portali Nextmag.pl. Nie wątpię w rzetelność Kaspersky Lab, bo kto jak kto ale ta firma ma naprawdę ogromny wkład w sprzątaniu syfu po Microsofcie rozwój bezpieczeństwa komputerów, ale najpierw rozbawiło mnie oświadczenie:

Podczas przeprowadzania badania nie zostały złamane żadne zabezpieczenia. Nazwy sieci i ich dokładna lokalizacja nie zostały nigdzie ujawnione, żadne dane nie zostały zgromadzone ani też nie były przetwarzane

Może się czepiam szczegółów, ale policzenie i przeanalizowanie danych o ilości sieci i ich zabezpieczeniach to też zgromadzenie i przetworzenie danych, ale rozumiem że po ostatniej aferze z samochodami Google Street View każdy chce się zabezpieczyć najlepiej jak to możliwe.

Do czego dążę: zaciekawiły mnie bardzo wyniki testu – 33% sieci nie jest w ogóle zabezpieczonych, co wcale prawdą być nie musi, bo np. w moim mieście wszędzie można wyszukać dostępne pozornie nie zabezpieczone sieci, którymi lokalni dostawcy internetu łączą np. poszczególne bloki z głównym węzłem. Skądinąd wiem też, że pomimo braku szyfrowania WEP/WPA na poziomie WIFI urządzenie na końcu odbierze wyłącznie sygnał szyfrowany protokołem SSL przy użyciu zestawu odpowiednich kluczy.

Nie mówię, że Kaspersky Labs nie wzięli takiego faktu pod uwagę (choć sprawdzenie tego mogłoby zostać uznane za próbę włamania się do sieci) ale po raz n-ty kłania się bardzo zły nawyk nie podawania źródła informacji przez autorów artykułów na serwisach internetowych. O ile w prasie drukowanej nie można do tekstu dołączyć 100 stron szczegółowego raportu o tyle w Internecie po to mamy linki, żeby z nich korzystać i uwierzytelniać swoje podsumowania. Na zachodnich portalach technicznych jest to standard, u nas wciąż można tylko wierzyć, że autor (dobrze jeśli w ogóle się podpisze) tekstu nie wyssał z palca.