SearchWiki від Гугля: чому так довго? Чому так мало?

24 грудня 2006 року, кілька цитат з мого посту та з матеріалу на якому він базувався:

“…results given by basic and advanced search engines are nice and useful, but still made by machines, not humans…”

“КОРИСТУВАЧІ МАЮТЬ НАГОДУ САМІ ВПЛИВАТИ НА ПОШУКОВИЙ РЕЙТИНГ САЙТІВ!!! … кожен може взяти в результаті пошуку і пересунути сайт вище чи нижче залежно від його вподобань!”

“…як? та просто мишкою зловити і пересунути:) …”

“we believe that Web Searches are quite good, but not as smart as a human brain could do. As today we are forced to accept the order given by search engines and click the results as they are, unfortunately this does not mean the human searcher agrees with the returned results index. Moreover clicking a result does not mean the website contains the contents we were looking for.
Starting from these thoughts we have started to think about a new way to interact with web searches and a new project, codename Yoople!, has born with the aim to give a human touch to the typical user experience with search engine indexing.”

Так-так, це ще мій старезний пост на безліміті про Yoople!

Отже, SearchWiki від Гугля…
ЧОМУ ТАК ДОВГО??? - адже технології та ДІЮЧІ прототипи існують вже як мінімум три роки!!! (це я написав про той же Yoople! 24 грудня 2006 року, а скільки він уже до того фуричив? А за скільки до того існував просто як ідея і технологія?)

І - ЧОМУ ТАК МАЛО??? - адже вже тоді, в далекому 2006-му році думка сягнула набагато далі: зробити не просто такий собі “кастом сьорч”, а шоби зміни в результатах, скориговані користувачами, визначали ранжування видачі!
Тепер же усе якось дуже скромно: “Зверніть увагу, що зроблені вами зміни впливають тільки на ваші власні результати пошуку” (принаймні, офіційно…)…

Чесно кажучи, я як шукав шось в гуглі і вперше побачив, шо там можна ранжувати видачу - одразу зрадів: мовляв, от вона, нарешті, революція пошуку, от вона - ЯКІСНА зміна видачі!
Ага, розбігся:)

___________________________________

Ну ще кілька конкретних ремарок (перед тим як традиційно порину в не надто структуровані роздуми):

1. Це, безперечно, брехня. Про “тільки на ваші власні результати пошуку” - гугл не може бути аж настільки дурним би не використати таку файну можливість: бо якшо кілька мільйонів людей видалить на фіг зі свого пошуку якогось сайта, та ще й понаписують в коментах шо він явно гавняний - було би тупо на це не відреагувати і не викинути той ресурс з видачі.

2. Навіщо ж брехати? Тому що гугл став надто великим монстром, структурою, системою - яка тримається на численних важелях протидії, і яка (система) включає в себе в тому числі і чорних сєошніків, і продажні лінки і все решту; і йому ввижається надто небезпечним робити різкі рухи - коли система є дуже великою і дуже складною, то навіть найменший необачний порух - ніколи до кінця не прорахуєш шо він спричинить в подальшому.

3. Навіщо ж брехати-2 і Чому так довго-мало? Тому що гугл став надто великим монстром-2, структурою, системою - яка включає в себе до біса багато різних сервісів, фішок, напрямків розвитку; серед яких першопричинна власне функція безпосередньо пошуку відійшла вже й, мабуть, навіть не на другий план, а куди далі
Ні-ні, не кажу, шо пошук - другорядна функція гугля (хоча можна і посперечатися вже…), але кажу, шо в черзі на РОЗВИТОК І ОНОВЛЕННЯ - таки далеко не першочергова: пошук є? - є, до нього звикли? - звикли, працює? - вроді як працює; так нашо його кардинально змінювати?
В той час як багато іншого вимагає таки шустреньких заходів із вдосконалення та модернізації.

*************************************************

Ну а тепер традиційні вже “не надто структуровані роздуми”(с).

Пошук від гугля стає все галімішим і галімішим. Релевантність пошуку - гугл за нього вже, вочевидь, навіть і не намагається відповідати, особливо якшо пошуковий запит є потенційно “комерційним”.
Якісно змінити систему пошуку можна для того ж гугля швидко й відносно легко - не проблема.
Так в чому ж прікол? Чому це не робиться?

Та дуже просто: в дикі мережеві часи дійсно було таке шо “ніхто і нізвідки” може прийти, видати якесь нове ефективне рішення, надибати в сіліконовій долині інвестора і попустити будь-якого авторітєта (КОМУ ЯК НЕ ГУГЛЮ ПРО ЦЕ ДОБРЕ ЗНАТИ???);
так-от: молодий парубок прийшов, убив дракона - і сам ним став. Але став драконом уже розумнішим: таким, шо знає звідкіля приходять молоді парубки і як їх мочити заздалегідо до того як вони здатні будуть замочити тебе.

Тобто отримали СИСТЕМУ - велику і могутню, а ГОЛОВНЕ - ТАКУ, ШО ЗДАТНА ЕФЕКТИВНО ЗАХИЩАТИСЯ. Захищатися від усього надто корисного для кінцевого споживача (ну бо хто може прорватися на ринок із самих низів якшо не може запропонувати шось реально виграшне?) - і на це, думаю, іде стільки ресурсів, за які можна було б (при бажанні) вже ого-го як покращити життя усім нам (простим смертним).

“КОЛИ ЦЕ ВСТИГЛО СТАТИ РЕЛІГІЄЮ?” (з “піратів силіконової долини”) - а от встигло, і вже досить давно.
В розрізі чого

ГУГЛЬ ХОЧЕ, БИ МОЛИЛИСЯ НА НЬОГО, А НЕ НА ПІПЛ (який, як відомо, усе хаває).

На кого рівняється весь інтернет, під кого все заточується, на кого моляться (і як дехто стверджує - навіть дрочать)? - на того, хто дає видачу;
А якшо видачу буде формувати сам кінцевий споживач, тобто звичайнісінький користувач - так шо ж получається, шо веб-сторінки потрібно буде заточувати не під пошуковики, а під дійсно людей?
Богохульство якесь получається!

Насправді усе ще простіше: толковий алгоритм видачі можна було зробити ще багато років тому. А не зробили лише тому, шо, по-перше, мають можливість гасити усіх інших, хто таке зробить (тобто не боятися конкурентів); а по-друге - тому, шо це самим собі, коханим, не вигідно.

Ще один цікавий момент: аж ніяк не може залишитися непоміченим самими гугльовцями той факт, шо в результаті оцієї “божественності” та нерелевантності видачі з’являється все більше структур, яким гугл абсолютно до лямпочки.
Бо раз утворюється вакуум (хочу шось знайти - а гугл просто не здатний в цьому допомогти!) - хтось та мусить його заповнити. І ЦЕ РЕАЛЬНИЙ ПРОВТИК З БОКУ ГУГЛЯ.

ПРИКЛАД З ЖИТТЯ:
шукав нещодавно одну-єдину пісеньку. НЕ нову, а ще з 2006-го року. Задав пошуковий запит в гуглі - видало багато всього: і про виконавців, і видалені ще минулого року теми на форумах де хтось шукав ту ж саму композицію, і, як то водиться, ще купу сміття, яке взагалі не має жодного відношення до шуканого.
В результаті - витратив до фіга часу.
В результаті - не знайшов те, шо шукав.

А потім просто зайшов на вконтактє, в рядку пошуку задав той самий пошуковий запит і обрав параметри пошуку “за аудіозаписами” - один клік мишкою і видало БАГАТО результатів, і УСІ ВОНИ БУЛИ РЕЛЕВАНТНИМИ.
Жодного “лівака”, просто видало мені те, шо я хотів знайти.

Чи цікавить хлопців з вконтактє видача гугля?
Чи цікавить хлопців з торрентс.ру видача гугля?

Ну і наостанок: чи не з’являться невдовзі сервіси на кшталт
“за 10ВМЗ пересунемо твій сайт догори з двох тисяч аккаунтів гугля у видачі за конкретним пошуковим запитом” та
“шукаємо народ на вірусний маркєтінг: за стільки-то коментів до результатів видачі гугля за таким-то запитом 2ВМЗ”?

ПС
Був у від’їзді, приїхав - побачив оцю нову фішку в гуглі. СПЕЦІЯЛЬНО не читав по блогосфері жодних думок стосовно цього - тож якшо десь хтось подібне шось казав, то я такого не бачив (але радий буду побачити); якшо ж навпаки - хтось десь це все вже обґрунтовано спростував, то також не бачив але так само радий буду побачити:)

Не сотворіть собі кумирів і пам’ятайте, шо скоро літо;)

А, так, мало не забув - треба ж лінка на Ярослава поставити:)

11 Comments

  1. None Smilodon:

    Я думаю що ґуґл реально давно не знає як працює його пошукова система. Більш того, передбачаю що там втиху використовують лінки з дмейла та джіталка, куплені соціальні закладки та купу іншого ім’я якому леґіон. Система стала такою складною що екперементально перевірити важливість тієї чи іншої фішки стає все складніше, в ход ідуть методи статистики. При певній кількості заплаток які накладаються на інші заплатки, розуміння “як працює” зникає. Можу навіть передбачити що частішають випадки “ручного ранжування”. І найгірше, наймовірніше ґуґл давно вже не контролює свою інфраструктуру. т.ч. не знає що у нього діється на апартному рівні. Тому це “чорна скриня”.

    Щодо соціалізації пошуку, я би не був таким захопленим від нього. Блоґосфера довела що велика кількість думок веде не до об’єктивізації інформаційного поля, а до її гіперсуб’єктивізації. Уявимо що ця функція буде заявлена відверто, що тоді почнеться? Євреї будуть масово “мінусувати” всі тексти в яких вислдовлюються сумніви по холокосту, екологи ті де є факти проти теорії “промислових джерел глобального потепління”, собачники де є факти що будь-які засоби боротьби з проти бродячих тварин крім як знищення неефектиіні, а це тільки найпростіші групи тиску… є ще професійні борці зі снідом, кремлівські патріоти (для яких України не існує), маленькі дискриміновані меншини. Таким чином маленькі але організовані групи негідніків зможуть робити НЕДОСТУПНОЮ ту інформацію, яка їм не подобається. І вони будуть це робити. Соціальний соліпсизм у дії.

  2. g_i:

    Так, блоґосфера дійсно яскраво демонструє геніяльність “колективного свідомо-безсвідомого”; але ж є позитивні приклади!
    Взяти Вікіпедію - можливо, я про це не чув, але по-моєму немає якихось яскравих згуртованих дій певної достатньо великої групи людей з однорідними ідеологічними (чи будь-якими іншими) переконаннями, які би активно лобіювали свою точку зору і видаляли усі протилежні.

    чи візьмуться реально мільйони людей видаляти якісь результати пошуку і навпаки просувати інші?
    якщо і так - чи буде їхня діяльність постійною, а не разовою якоюсь акцією?
    просто важко повірити, що дійсно настільки значні маси користувачів от усі свої справи позалишають - і присвятять енну кількість свого часу під просування “своїх” та видалення “чужих” ресурсів…

    зрештою - чому б не спробувати? ресурсу для того в гугла більш ніж достатньо - може собі дозволити запустити такий собі пілотний варіянт і просто подивитися що з того получиться;
    як варіянт - можна не на усі сто відсотків віддати ранжування видачі в руки широких мас (це ж дійсно було б неконструктивно - бо є настільки маловживані запити, що ніхто й не візьметься їх коригувати..): зробити такий собі базис у вигляді машинного ранжування згідно з алгоритмом, і надбудову - у вигляді коригування видачі із врахуванням думки громадськості.

    врешті-решт, можна організувати таку собі мережу “авторизованих” представників гугля як то зробила система “вебмані”: коли атестаторів, наприклад, багато - і кожен достатньо дорожить своєю справою та економічною вигодою аби не дозволити собі вчинити врозріз із правилами системи.

  3. None Smilodon:

    1. ви трохи не в курсі, вікіпедія є якраз найбільшим розчаруванням. справа в тім що деякий час тому декілька сотень полоумних прихильників теорії “промислових джерел глобального потепління” нагабно “випили” з вікіпедії альтенативну думку РЕАЛЬНОГО науковця. Якщо вам мало то подивіться на російську вікіпедію.

    2. Багато не потрібно, достатньо деякої кількості тисяч активних вилупків. Повірте, я був в серед організаторів таких груп.

    3. “авторизовані” це вже еліта, якщо це так, то у нас вже є і на зарплаті, то навіщо тоді новні?

    Як на мене, теорія “Веб 2.0″ ущербна від початку, вона зайва сутність. Якщо вона хоч трохи відповідає дійсності, то нас чекає нове середньовіччя у найгіршій формі (Галілей: “А все-теки вона крутиться!”, Анонімний Інкізитор: “ban_set Галілей”), ну а якщо це дурня… то навіщо витрачати час?

  4. g_i:

    ну ок, приймемо “ініціативні” групи: так чому ж такі групи не виникнуть з протилежного боку барикад, і чому вони не врівноважать одне одну?
    одні - видалили, інші - додали; за деякий час кожен бачить, що змісту в цьому абсолютно ніякого і всі йдуть пити пиво. як варіант.

    на рахунок еліти - дійсно, як не крути, а якшо її стане забагато то контроль ускладниться; але я мав на увазі саме люди, які б контролювали адекватність видачі, а не такі, шо “на зарплаті” і виконують якісь інші функції.

    чому це теорія “Веб 2.0″ ущербна? вона не ущербна, вона просто неповна:) масам - веб-два-нуль, реальним людям - реальна реальність, реальні можливості та реальна інформація.
    Хіба не так завжди було??:)

    але все ж, стосовно пошуку: очевидно ж, що видача є неадекватною. Як Ви вважаєте - що із цим можна реально зробити?
    чи це неважливо і користуватися альтернативними джерелами інформації?

    І до речі - кажете, були серед організаторів “таких груп”: от скажіть - чи в кінцевому підсумку їх діяльність виявилася аж такою ефективною? І чи довго існують подібні групи, який їх життєвий цикл?
    Чи не здіймають вони просто “бурі в склянці” щоб було чим прозвітувати замовникам? чи здатні вони викликати СТАЛИЙ ефект, а не якісь сплески активності які невдовзі уже й не згадає ніхто?

  5. None Smilodon:

    1. протилежні групи виникають, але вони не в врівноважать ситуації тому-що: а. частина ініціативних груп мають прибутки зі своїх переконань б. частина груп мають ірраціональні переконання, т.ч. складається з фанатиків та психів. у війні правок перемога буде за ними.

    2. я про і говорю. ми вже маємо платних спеціалістів ґуґла, так навіщо нам кляса накталт бюрократів-вікіпідорів?

    3. “Веб 2.0″ ущербна тому-що визначально будувалось на “зайвій сутності” яка відмінно ріжеться лезом Оккама.

    4. я не певен що результати є неадекватними. є певний набір трюків яким можна його покращити.

    5. ефективність груп тиску зумовлюється в першу чергу тим, що маленька але організована купка негідників завжди перемагає велику але неорганізовану масу. динаміка приблизно наступна: 1. поява приводу організовуватись 2. поява організації та початок її роботи 3. холівари з супротивниками. 4. поява матеріально зацікавлених у цілях організації сторонніх осіб 5. контакт з владою, створення стимулів для чиновників 6. протискування рішення 7. холівари з ображеними 8. заспокоєння зовнішніх фронтів і початок дрібних сварок в самій групі 8. поступове згортання групи, активізація тільки пресингу на спроби активізації супротивників.

  6. g_i:

    Хм… Погодьтесь, уся західна цивілізація побудована на “зайвій сутності” і відмінно ріжеться лезом Оккама: зайві результати праці, зайві предмети вжитку, зайві кошти - це ж основоположні стовпи нашого нинішнього існування!
    Тож чому саме “веб-два-нуль” - це ж не є якесь відособлене явище, це просто елемент “іще чогось зайвого (чи “вільного” як люблять казати)”, який чудово вписується в загальну “зайвосутнісну” модель!

    http://geo.webmoney.ru/wmobjects/RegionList.aspx?country=232&lang=ru - ну ось подивіться (знову як приклад той же вебмані), ці усі люди зовсім не є бюрократами:) і усі вони адекватно працюють, і система побудована таки вдало: і ефективність роботи гарна, і оскарження рішень забезпечено, і контроль за діяльністю

    Ну ось, дійшли тобто до того, що видача “в принципі і так нічого собі”?

    Групи тиску ІСНУВАЛИ, ІСНУЮТЬ І БУДУТЬ ІСНУВАТИ ЗА БУДЬ-ЯКОЇ МОДЕЛІ ІНФОРМАТИЗАЦІЇ - де буде хоч якась інформація, там будуть і групи тиску.
    Так і що, через них нічого не міняти?
    Може якраз навпаки - рішення проблеми стане нагальним саме тоді, коли і проблема надто вже наглою і тотальною: соціалізується, наприклад, видача; надто вже наглими і явними стануть дії подібних елементів - і тоді стане реальне питання “шо ж із ними робити”.
    Тобто “довести до загострення аби локалізувати проблему і вирішити її”

    А видача таки неадекватна. Так, є купа прийомів, є альтернативні джерела інформації - але якшо вже гугл хоче дійсно шось толком шукати, то має шось міняти рано чи пізно.

  7. None Smilodon:

    1. підміна понять, до того ж примітивна. лайвджорнал, дігги, файсбуки та віттери це звичайні веб-сервіси в яких нічого нового чи революційного немає. тай стенд-елон блоґ нічим не відрізняється від звичайного хом’ячка. вводити спеціальний претензійний термін “Веб 2.0″ для цього - створювати зайвий ажіотаж, в стилі R.I.P. мильної бульбашки “інтернет-економіки” кінця 90-х. Проведіть екперимент, візьміть відповідні тексти 99 року та замініть “портал” та “стартап”. Зміст не зміниться абсолютно.

    2. система вебманей деідеологічна, побудована на грошах. і повірте, її вже атакують. наразі банківський картель на рівні держрегулювання, але скоро у справу підуть борцуни проти расизму які ВНЄЗАПНО помітять що вебманей користуються ФОШИСТИ.

    3. питання в тому хто починає тиснути і як. спробуйте потиснути в плані чиїхось прав в державі якою править хунта і отримаєте адекватну реакцію. якщо ціль довести що групи тиску перетворюють все на лайно, то ціль не має змісту адже це давно доведено.

    можливо має зміст створити пошуковий сервіс чий алгоритм буде відкритим. групи тиску будуть, але люди без знання програмування будуть виключатись з процесу автоматично й крім того, рано чи пізно може виникнути достойний алгоритм.

  8. jarofed:

    Як на мене, все-таки алгоритм пошуку повинен бути об’єктивним (читай, не залежати від чиїхось маніпуляцій). І в цьому плані дуже правильно, що вподобання окремих людей впливають “тільки” на їх видачу. І, чесно кажучи, я б не був таким впевненим, що Гугл тут бреше (хоча це й не виключено). А якщо й бреше - то вочевидь для того, щоб не з”являлося отих систем: “просуну ваш сайт по 2000 гугл-аккаунтів”.

  9. g_i:

    так шановне панство, алгоритм усе-таки колись “можливо, буде досконалим”, чи суспільство стане досконалішим і тоді по барабану який алгоритм використовувати - усе одно видача буде релевантною?

    взяти відповідні тексти?
    а чому з 99-го року? можна ж узяти тексти тисячолітньої давності - і дійсно по суті нічого нового в тому не буде: ті ж проблеми, ті ж прийоми, та ж суть і та ж мета.
    але ж шо б ми не взяли - потрібно визначитися з рівнем деталізації: тобто чи вважати одну якусь зайву мульку вже чимось “новим” чи навпаки - здоровенну новобудову вважати чимось абсолютно архаїчним “бо цілі ті ж самі, та й технологіх, по великому рахунку, також: фундамент, стіни, дах…”

    бо якшо один із нас бере одну деталізацію, а інший інакшу, третій, четвертий, десятий - іще якусь, то розмовляти про одні й ті самі речі можна таки дуже і дуже довго:)

    і я знову ж схиляюся до того шо як і “зайві” “лишки” є основоположним стовпом нашої наразі цивілізації - так і постійний “прогрес” та “новизна” є таким самим стовпом;
    зрештою, ті ресурси, шо звуть себе “веб-два-нульними” називай як хочеш - вони від цього існувати не перестануть, і мільйони людей там тусуватися також не перестануть.

    ну стосовно пошуку - бачу, більшість таки схиляється до того, шо його “соціалізація” - штука негативна.
    що ж, цілком імовірно, шо так воно і є..
    з іншого боку - якшо КОЖЕН користувач візьме і видалить зі своєї видачі якись конкретний ресурс, то це ж також буде соціалізація; бо получиться, шо його нікому показувати і не буде.

    ще з іншого боку - якби не МИ САМІ (тобто юзери, вебмайстри та сєошнікі) поводилися безкорисливо і чесно - то пошук і так був би набагато чистішим.

    загалом - найпростіше ж просто залишити усе як є і не чіпати, тим більше якшо не знаєш достеменно до чого призведе будь-яка зміна. мабуть, так і буде:)

  10. Роман:

    Можна нїжіти не гугл. Він дійсно монстр в пошуку і його алгоритми не досконалі. А от яндекс ще гірший. Подавав я свій сайт ukrprog.com для реєстрації та індексайції. Так його відповідь дуже проста “Я не бачу такого сайту” (примітка: і не хочу бачити, бо подава не раз). Звісно, для чого його бачити, якщо там ні однієї російської літери нема. Яша ж розрахований для російськомовної аудиторії. І теж монстр.
    Та і зараз за кілька років в пошуку такого сайту не існує. Є тільки лінки з інших сайтів що тай існує. Тому я, принципово, навіть контекстну рекламу туди подавати не буду. Навіщо москалів годувати.

  11. g_i:

    та яндекс - не знаю, от ніколи ним не користувався..
    лиш яндекс-фотками, усе решта якось не прижилося

Leave a comment


Також по темі