Я работаю над проектом очистки веб-страниц с использованием ASP.NET C#, и мне нужно автоматически обрабатывать изображения CAPTCHA. В частности, мне нужно извлечь текст из изображений CAPTCHA и заполнить его в форме без ручного вмешательства.
Какие библиотеки или методы я могу использовать для решения этой проблемы на C#? Существуют ли библиотеки OCR (оптического распознавания символов), которые хорошо работают с изображениями CAPTCHA в ASP.NET? Кроме того, существуют ли какие-либо рекомендации или инструменты, которые могут помочь обходить или обрабатывать CAPTCHA программно?
Я был бы признателен за пошаговые инструкции или примеры того, как это реализовать.
using OpenQA.Selenium;
using OpenQA.Selenium.Chrome;
using System;
using System.Drawing;
using System.Drawing.Imaging;
using System.IO;
using Tesseract;
namespace WebScraperDemo
{
class Program
{
static void Main(string[] args)
{
IWebDriver driver = new ChromeDriver();
driver.Navigate().GoToUrl("https://itat.gov.in/judicial/casestatus");
driver.Manage().Timeouts().ImplicitWait = TimeSpan.FromSeconds(10);
try
{
IWebElement captchaImage = driver.FindElement(By.XPath("//*[@id=\"captchaImage\"]"));
Screenshot screenshot = ((ITakesScreenshot)driver).GetScreenshot();
using (MemoryStream ms = new MemoryStream(screenshot.AsByteArray))
{
Bitmap bmpScreenshot = new Bitmap(ms);
var location = captchaImage.Location;
var size = captchaImage.Size;
Rectangle cropArea = new Rectangle(location.X, location.Y, size.Width, size.Height);
Bitmap captchaBitmap = bmpScreenshot.Clone(cropArea, bmpScreenshot.PixelFormat);
captchaBitmap.Save("captcha.png", System.Drawing.Imaging.ImageFormat.Png);
var ocrEngine = new TesseractEngine(@"./tessdata", "eng", EngineMode.Default);
using (var msCaptcha = new MemoryStream())
{
captchaBitmap.Save(msCaptcha, System.Drawing.Imaging.ImageFormat.Png);
msCaptcha.Position = 0;
using (var pix = Pix.LoadFromMemory(msCaptcha.ToArray()))
{
var captchaText = ocrEngine.Process(pix).GetText().Trim();
IWebElement captchaInput = driver.FindElement(By.Id("captcha"));
captchaInput.SendKeys(captchaText);
}
}
}
IWebElement submitButton = driver.FindElement(By.Id("SubmitButtonId"));
submitButton.Click();
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
finally
{
driver.Quit();
}
}
}
}
Подробнее здесь: https://stackoverflow.com/questions/793 ... in-asp-net
Как автоматически заполнить CAPTCHA изображением с помощью веб-скребка в ASP.NET C#? [закрыто] ⇐ C#
Место общения программистов C#
1736323350
Anonymous
Я работаю над проектом очистки веб-страниц с использованием ASP.NET C#, и мне нужно автоматически обрабатывать изображения CAPTCHA. В частности, мне нужно извлечь текст из изображений CAPTCHA и заполнить его в форме без ручного вмешательства.
Какие библиотеки или методы я могу использовать для решения этой проблемы на C#? Существуют ли библиотеки OCR (оптического распознавания символов), которые хорошо работают с изображениями CAPTCHA в ASP.NET? Кроме того, существуют ли какие-либо рекомендации или инструменты, которые могут помочь обходить или обрабатывать CAPTCHA программно?
Я был бы признателен за пошаговые инструкции или примеры того, как это реализовать.
using OpenQA.Selenium;
using OpenQA.Selenium.Chrome;
using System;
using System.Drawing;
using System.Drawing.Imaging;
using System.IO;
using Tesseract;
namespace WebScraperDemo
{
class Program
{
static void Main(string[] args)
{
IWebDriver driver = new ChromeDriver();
driver.Navigate().GoToUrl("https://itat.gov.in/judicial/casestatus");
driver.Manage().Timeouts().ImplicitWait = TimeSpan.FromSeconds(10);
try
{
IWebElement captchaImage = driver.FindElement(By.XPath("//*[@id=\"captchaImage\"]"));
Screenshot screenshot = ((ITakesScreenshot)driver).GetScreenshot();
using (MemoryStream ms = new MemoryStream(screenshot.AsByteArray))
{
Bitmap bmpScreenshot = new Bitmap(ms);
var location = captchaImage.Location;
var size = captchaImage.Size;
Rectangle cropArea = new Rectangle(location.X, location.Y, size.Width, size.Height);
Bitmap captchaBitmap = bmpScreenshot.Clone(cropArea, bmpScreenshot.PixelFormat);
captchaBitmap.Save("captcha.png", System.Drawing.Imaging.ImageFormat.Png);
var ocrEngine = new TesseractEngine(@"./tessdata", "eng", EngineMode.Default);
using (var msCaptcha = new MemoryStream())
{
captchaBitmap.Save(msCaptcha, System.Drawing.Imaging.ImageFormat.Png);
msCaptcha.Position = 0;
using (var pix = Pix.LoadFromMemory(msCaptcha.ToArray()))
{
var captchaText = ocrEngine.Process(pix).GetText().Trim();
IWebElement captchaInput = driver.FindElement(By.Id("captcha"));
captchaInput.SendKeys(captchaText);
}
}
}
IWebElement submitButton = driver.FindElement(By.Id("SubmitButtonId"));
submitButton.Click();
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
finally
{
driver.Quit();
}
}
}
}
Подробнее здесь: [url]https://stackoverflow.com/questions/79338339/how-to-automatically-fill-a-captcha-with-an-image-using-web-scraping-in-asp-net[/url]
Ответить
1 сообщение
• Страница 1 из 1
Перейти
- Кемерово-IT
- ↳ Javascript
- ↳ C#
- ↳ JAVA
- ↳ Elasticsearch aggregation
- ↳ Python
- ↳ Php
- ↳ Android
- ↳ Html
- ↳ Jquery
- ↳ C++
- ↳ IOS
- ↳ CSS
- ↳ Excel
- ↳ Linux
- ↳ Apache
- ↳ MySql
- Детский мир
- Для души
- ↳ Музыкальные инструменты даром
- ↳ Печатная продукция даром
- Внешняя красота и здоровье
- ↳ Одежда и обувь для взрослых даром
- ↳ Товары для здоровья
- ↳ Физкультура и спорт
- Техника - даром!
- ↳ Автомобилистам
- ↳ Компьютерная техника
- ↳ Плиты: газовые и электрические
- ↳ Холодильники
- ↳ Стиральные машины
- ↳ Телевизоры
- ↳ Телефоны, смартфоны, плашеты
- ↳ Швейные машинки
- ↳ Прочая электроника и техника
- ↳ Фототехника
- Ремонт и интерьер
- ↳ Стройматериалы, инструмент
- ↳ Мебель и предметы интерьера даром
- ↳ Cантехника
- Другие темы
- ↳ Разное даром
- ↳ Давай меняться!
- ↳ Отдам\возьму за копеечку
- ↳ Работа и подработка в Кемерове
- ↳ Давай с тобой поговорим...
Мобильная версия