Новая услуга. Очистка сайтов от JavaScript вирусов, попап-рекламы и прочей ереси.

Несколько раз мне ломали ftp и заливали на него всякие JavaScript вирусы, попаперы, левые ссылки и т.п.

Очистить сайты от этого всего мне не помогали даже лицензионные антивирусы (у меня стоит KIS) - все что они могут так это удалить все зараженные файлы, то есть половину сайта :)

Поэтому я придумал свой скрипт, при помощи которого я быстро и легко могу убрать все вирусы и рекламу с ваших сайтов.

Этапы сотрудничества:
1. Вы нашли вирусы или ненужную рекламу на своих сайтах.
2. Вы кидаете мне несколько зараженных страниц (очень часто вирусы пишутся под разным видом в разные файлы: php, html, js)
3. Я их анализирую и оптимизирую под них свой скрипт и пересылаю его вам.
4. Вы запускаете скрипт на своем сервере и ваш сервер чист.

Перед запуском скрипта ОБЯЗАТЕЛЬНО сделайте резервный дамп файлов.

Стоимость услуги: 20 $

Новые базы контента

Новые базы, которые насобирались за время отсутствия:

  1. База фильмов
    Количество фильмов в базе: 11 758
    Общий размер базы: 11,1 МБ (cp1251)
    Поля в базе: id, жанр, название фильма, продюссер, актеры, год выпска, страна, студия, продолжительность фильма, описание, имя файла с постером к фильму.
    Количество источников: 1.
    Описание базы: очень хорошая и большая база фильмов и аниме. имеются описания, постеры.
    Стоимость базы: 85 $ (WMZ)
  2. База сонников
    Количество записей: 6 810
    Общий размер базы: 1,5 МБ (cp1251)
    Поля в базе: id, категория (сонник Миллера, Сонник Ванги, Сонник Фрейда …), первая буква (для побуквенной сортировки), слово, трактовка.
    Количество источников: 1.
    Описание базы: хорошая большая база сонников, сочетает в себе множество видов сонников.
    Стоимость базы: 45 $ (WMZ)
  3. База русских актеров
    Количество записей: 1 219
    Общий размер базы: 16,6 МБ (cp1251)
    Поля в базе: id, буква сортировки (по алфавиту), ФИО актера, фильмы, в которых он снимался, заслуги (народный, заслуженный …), описание, название файла с фотографией.
    Количество источников: 1.
    Описание базы: хорошая база русских актеров. Практически к каждому актеру есть небольшая фотография
    Стоимость базы: 40 $ (WMZ)
  4. База частушек
    Количество частушек: 5 457
    Общий размер базы: 740 КБ (cp1251)
    Картинок нет.
    Поля в базе: id, категория, тип, частушка.
    Количество источников: 1.
    Описание базы: очень хорошая и большая база русских частушек.
    Стоимость базы: 50 $ (WMZ)

Наконец-то я здесь :)

Долго я ничего не писал, но на это были объективные причины - было ОЧЕНЬ много интересной и сложной работы. И именно эта работа позволила добиться больших результатов и создать интересные наработки, о которых я буду писать в следующих постах.

А пока первое нововведение - защита от спама. Когда у меня собралось 1800 комментов на модерацию, то я понял, что надо как-то защищаться от тупорылых комментов наподобии “автор молодец” или “красиво пишешь” и для этого поставил простой плагин, который просит вас ввести сумму сложения двух чисел. Надеюсь это не испугает моих постоянных читателей ;)

Правда в процессе очистки от мусора были утеряны и некоторые интересные комменты, но это уже операционные накладки. Зато теперь всем (и особенно мне) будет легче и проще посты и комменты к ним.

Ну поехали понемногу. Будем разгоняться.

Экономим трафик. Увеличиваем скорость.

Во многих проектах по парсингу (обработке) большого количества страниц очень выгодно использовать сжатие страниц на стороне сервера-источника. Это помогает экономить трафик со всеми истекающими плюсами.

Как проверить может ли сервер-источник сжимать контент?

Методов на самом деле очень много. Я же пользуюсь связкой Mozilla + Live HTTP Headers.
Для того, чтобы проверить может ли сервер-источник сжимать страницу, я запускаю Mozilla, потом Live HTTP Headers и ищу в ответе на запрос броузера поле Content-Encoding. Конечно же для более глубокого понимания всего процесса взаимодействия было бы неплохо знать спецификацию HTTP 1.1, но в и без нее можно обойтись.

Типичный ответ сервера-источника может выглядеть так:

Live HTTP Headers. Перехват

Как реализовать обработку «сжатых» страниц в своем PHP скрипте?

Для этого вам надо в своем коде сначала отправлять дополнительный заголовок. В своих скриптах я делаю это так:

$spider->AddHeaders[]=’Accept-Encoding: gzip’; // Как можно видеть на картинке выше, точно такое же поле отправляет и наш броузер
$spider->GetContent();

А внутри класса обрабатываем это дополнительное поле таким нехитрым кодом:
curl_setopt($this->curl_handler, CURLOPT_HEADER, $this->Headers);

После получения контента нам надо сделать еще одно необычное действие, добавив еще строку кода:

$spider->Result=gzinflate(substr($spider->Result,10));

После проведения этой операции в $spider->Result будет уже удобоваримый контент, который можно обрабатывать.

У вас также могут возникнуть вопросы по поводу числа 10 в функции substr. Скажу что выбрано оно не случайно :). Это связано с тем что моды Апача, которые занимаются сжатием, неправильно отдают заголовки сжатого контента. Мы же их обрезаем и просто «расжимаем» контент. Скаже сразу, что этот код будет работать в 90% процентах случаев. Если же у вас он по какой-то причине не работает, то советую почитать комменты к функции gzinflate на сайте php.net. Думаю там вы найдете ответы на все ваши вопросы.

Что мы получаем в результате использования данного подхода?

На самом деле получаем очень много. Мы экономим трафик и увеличиваем скорость обработки, что крайне важно на больших проектах, особенно если источник находится за много прыжков от нас (посмотреть это можно при помощи команды tracert в консольном режиме Windows).

По поводу скорости я провел пару исследований. Средняя скорость загрузки (10 последовательных тестов) со сжатием составила примерно 0.5 секунды, без сжатия - 0.85 секунды. Сайт-источник находился от меня на расстоянии 10 прыжков (а если говорить правильнее, 10 промежуточных точек или 10 маршрутизаторов). В вышеуказанное время уже включены накладные расходы на “расжатие” страниц для первого теста и на удаление всех вайтспейсес ([\n\r\t]) для обоих случаев.

Как мы видим выигрыш получился равным 40%!!! Поэтому советую для крупных проектов взять эту технику себе на вооружение.

Новые базы контента!

Предлагаются на продажу следующие “свежие” базы данных:

  1. База автомобильных статей
    Количество статей: 2 929
    Общий размер базы: 19,7 МБ (cp1251)
    Количество картинок к статьям: 7651 (138 Мб)
    Поля в базе: id, название статьи, статья, изображения к статье.
    Количество источников: 1.
    Описание базы: качественная база автомобильных статей, проверенна на дубли. В базе оставлены ссылки на источники информации.
    Стоимость базы: 80 $ (WMZ)
  2. База рецептов
    Количество рецептов: 23 812
    Общий размер базы: 26,3 МБ (cp1251)
    Картинок нет.
    Поля в базе: id, название рецепта, рецепт.
    Количество источников: 1.
    Описание базы: качественная база самых разнообразных рецептов, проверенна на дубли. В базе оставлены ссылки на источники информации.
    Стоимость базы: 80 $ (WMZ)

Минимальная стоимость на услуги по переводу баз данных!

С сегодняшнего дня стоимость услуг по переводу баз данных составляет 20 $ за таблицу вне зависимости от ее размера!!!

Подробности по поводу системы по переводу баз данных смотрите тут!

Новая услуга! Автоматизированный машинный перевод контента в базах данных MySQL.

Предлагаю на суд общественности новую услугу – автоматизированный машинный перевод контента в базах данных под управлением MySQL.

При помощи этой услуги вы можете на основе уже имеющегося у вас неуникального контента получить большой объем уникального переводного контента.

Подробности о данной системе вы можете узнать тут.

Сбор информации на чужих компах ???!

На днях на одном из популярных порталов о поиске работы для фрилансеров weblancer.net заметил интересный проект, который дословно называется Сбор информации.

Если особо не вникать в проект, то может показаться, что это халтурная работа для людей у которых по ночам “простаивает” комп и инет. Но в то же время, я, как человек предоставляющий услуги в этой же области, задумался, а кому надо тратить дополнительные деньги, пусть и небольшие, на то, чего и так валом (инет и компы)? Нет ли тут какого-то подлога? Не отрубят ли вас потом от инета за нарушение каких-то авторских прав или еще чего-то подобного?

Советую людям, которые оставили комменты к данному проекту, задуматься над этими вопросами. Потому что я, например, никогда не прибегал бы к помощи сторонних людей, потому что это вводит в систему сбора информации еще один и достаточно неконтролируемый фактор - человеческий (без учета человеческого фактора самого себя :) ).

Думайте! И не ошибитесь!

Новая услуга - скачивание видео с сервисов YouTube и ему подобных!

Представляю на суд общественности новую услугу - копирование видео с таких сервисов как YouTube, Rutube, Mail.Ru, VKontakte, LoadUp …

Описание:
Очень часто перед многими из веб-мастеров стает задача сбора большого количества тематического видео для своих ресурсов. Конечно же, если надо скачать 5 роликов, то проще воспользоваться какой-то программой на подобии YouTube Downloader. А если роликов свыше 100 или даже 1000??!

Тут то вам и пригодятся наши услуги.

При необходимости все скачанное видео может быть сконвертировано в любой удобный для вас формат (как известно, видео с YouTube качается в формате FLV, который поддерживается достаточно малым количеством программам для просмотра видео).

Стоимость услуги договорная и зависит в первую очередь от размеров и количества скачиваемых файлов. Для больших заказов возможны скидки!

Обращайтесь! Будем рады помочь!

База ноутбуков с техническими характеристиками и картинками

Продается база ноутбуков с техническими характеристиками и картинками.

База: MySQL dump | CSV

Количество производителей в базе: 13
Информация о производетелях: имя, путь для ЧПУ.

Количество ноутбуков в базе: 1 610
Все технические характеристики расположены в отдельных унифицированных полях.
Информация о ноутбуках телефонах: ссылка на id производителя из первой таблицы, модель, количество предложений по интернет магазинам Украины, минимальная цена в интернет-магазинах Украины, средняя цена, максимальная цена в интернет-магазинах Украины, набор полей с техническими характеристиками, набор полей для хранений адресов главной и дополнительных картинок.
К ноутбукам имеется по 3 или по 6 картинок. Большая, маленькая и средняя для каждого вида.

Просмотреть пример информации из базы и набор полей вы можете тут.

База очень чистая и качественная. Идеально подходит как для каталога ноутбуков, так и для интернет-магазина.

Стоимость базы: 90 $

В стоимость базы НЕ ВХОДИТ портирование и обработка базы под ваши нужды.