Рейтинг темы:
  • 0 Голос(ов) - 0 в среднем
  • 1
  • 2
  • 3
  • 4
  • 5
Парсер email
#11
Спасибо Smile
Ответ
#12
Effas Написал:Удали все таблицы кроме Емейла, затем конверт в тхт, в чем сложность?!
И правда, не вижу смысла изобретать велосипед, когда можно сделать парой нажатий кнопок.Wink
Ответ
#13
Avalon Написал:И правда, не вижу смысла изобретать велосипед, когда можно сделать парой нажатий кнопок.Wink

Сразу видно, што не программер ни разу... тут дело не в изобретении велосипеда, а в автоматизации процесса... это как в мультике "Крылья, ноги и хвосты" - "Лучше 2 часа потерять, потом за 5 минут долететь"...
Ответ
#14
Arzamas Написал:
PHP код:
<?php
$path
= "./forum.sql"; //путь к файлу с мылами
$save_path = "./result.txt"; //файл результата
$pattern = '/\b[A-Z0-9._%+-]+@(?:[A-Z0-9-]+\.)+[A-Z]{2,6}\b/i';
$contents = file_get_contents($path);
preg_match_all($pattern,$contents,$matches);
foreach(
$matches[0] as $value){
file_put_contents($save_path,"$value\r\n",FILE_APPEND);
}
?>

Скачать это безобразие => _http://rghost.ru/37152550

З.Ы. Скаченное распаковать, открыть email.php, вписать необходимые пути, запустить start.bat, радовацца...
Можно чтобы эта программа каждый раз сама меняла названия файлов result1 result2 и т.д.Хотя исходный файл всеравно придётся самому менять, так что не очень облегчит.
Ответ
#15
PHP код:
<?php
$dir
= "./files"; //путь к папке с обрабатываемыми файлами
$res_dir = "./result"; //путь к папке для файлов с результатом
$pattern = '/\b[A-Z0-9._%+-]+@(?:[A-Z0-9-]+\.)+[A-Z]{2,6}\b/i';
$handle = opendir($dir);
while((
$file = readdir($handle)) !== false){
if(
$file != "." && $file != ".."){
echo
"Parse $file...";
$save_path = "$res_dir/". $file. "_res.txt";
$contents = file_get_contents("$dir/$file");
preg_match_all($pattern,$contents,$matches);
foreach(
$matches[0] as $value){
file_put_contents($save_path,"$value\r\n",FILE_APPEND);
}
echo
" OK\r\n";
}
}
closedir($handle);
?>

Вот собственно... указываешь папку в которой лежат все файлы которые тебе надо обработать, скрипт их автоматом по кругу проверит, и все найденные в мыла из каждого файла сложит в отдельный файлик в папке для результатов...
Ответ
#16
Как можно постчитать сколько у меня емейлов в файле собрано,просто интересно.
Ответ
#17
Пф... Файл в txt формате, 1 мыло - 1 строка?
Открываешь блокнотом файл, Вид->Строка состояния. Там смотришь кол-во строк)
Ответ
#18
Скрипты и т.д. зачем? Если файл 100500мб, то сколько ж это по времени и ресурсам будет?
grep -o -h "[a-zA-Z_0-9\.-]*@[a-zA-Z0-9\.-]*\.[a-zA-Z]*" -- *.* | uniq | sort > mails.txt

А далее уже скриптом, тот список который получился. Чтобы удалить те которые не соответсвуют формату email.
Ответ


Возможно похожие темы ...
Тема Автор Ответы Просмотры Последний пост
  Парсер данных с банковского сайта валюты GenCloud 2 1,434 04-10-2016, 11:54 PM
Последний пост: GenCloud
  Email рассылки Xeonc 2 1,596 07-28-2015, 07:19 AM
Последний пост: Denwer
  Посоветуйте десктопный парсер веб контента Agares 4 1,878 04-16-2013, 09:35 AM
Последний пост: Agares
  Парсер DAT->DAT, DAT->SQL MrShyr 2 2,932 03-01-2013, 12:21 AM
Последний пост: SkyWard
  парсер дроп листа DuMoH4uK 0 949 01-11-2013, 09:20 PM
Последний пост: DuMoH4uK
  Парсер DAT, Перловка MrShyr 0 1,300 10-11-2012, 07:25 PM
Последний пост: MrShyr

Перейти к форуму:


Пользователи, просматривающие эту тему: 3 Гость(ей)