Я работаю над проектом очистки веб-страниц с использованием ASP.NET C#, и мне нужно автоматически обрабатывать изображения CAPTCHA. В частности, мне нужно извлечь текст из изображений CAPTCHA и заполнить его в форме без ручного вмешательства.
Какие библиотеки или методы я могу использовать для решения этой проблемы на C#? Существуют ли библиотеки OCR (оптического распознавания символов), которые хорошо работают с изображениями CAPTCHA в ASP.NET? Кроме того, существуют ли какие-либо рекомендации или инструменты, которые могут помочь обходить или обрабатывать CAPTCHA программно?
Я был бы признателен за пошаговые инструкции или примеры того, как это реализовать.
using OpenQA.Selenium;
using OpenQA.Selenium.Chrome;
using System;
using System.Drawing;
using System.Drawing.Imaging;
using System.IO;
using Tesseract;
namespace WebScraperDemo
{
class Program
{
static void Main(string[] args)
{
IWebDriver driver = new ChromeDriver();
driver.Navigate().GoToUrl("https://itat.gov.in/judicial/casestatus");
driver.Manage().Timeouts().ImplicitWait = TimeSpan.FromSeconds(10);
try
{
IWebElement captchaImage = driver.FindElement(By.XPath("//*[@id=\"captchaImage\"]"));
Screenshot screenshot = ((ITakesScreenshot)driver).GetScreenshot();
using (MemoryStream ms = new MemoryStream(screenshot.AsByteArray))
{
Bitmap bmpScreenshot = new Bitmap(ms);
var location = captchaImage.Location;
var size = captchaImage.Size;
Rectangle cropArea = new Rectangle(location.X, location.Y, size.Width, size.Height);
Bitmap captchaBitmap = bmpScreenshot.Clone(cropArea, bmpScreenshot.PixelFormat);
captchaBitmap.Save("captcha.png", System.Drawing.Imaging.ImageFormat.Png);
var ocrEngine = new TesseractEngine(@"./tessdata", "eng", EngineMode.Default);
using (var msCaptcha = new MemoryStream())
{
captchaBitmap.Save(msCaptcha, System.Drawing.Imaging.ImageFormat.Png);
msCaptcha.Position = 0;
using (var pix = Pix.LoadFromMemory(msCaptcha.ToArray()))
{
var captchaText = ocrEngine.Process(pix).GetText().Trim();
IWebElement captchaInput = driver.FindElement(By.Id("captcha"));
captchaInput.SendKeys(captchaText);
}
}
}
IWebElement submitButton = driver.FindElement(By.Id("SubmitButtonId"));
submitButton.Click();
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
finally
{
driver.Quit();
}
}
}
}
Подробнее здесь: https://stackoverflow.com/questions/793 ... in-asp-net
Как автоматически заполнить CAPTCHA изображением с помощью веб-скребка в ASP.NET C#? [закрыто] ⇐ C#
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Поиск надежного скребка или библиотеки Python для обхода Captcha на ecourts.gov.in
Anonymous » » в форуме Python - 0 Ответы
- 7 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Как я могу реализовать аудио-считыватель CAPTCHA с помощью django-simple-captcha в Django?
Anonymous » » в форуме Python - 0 Ответы
- 56 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Как исключить классы div «modal-content» и «modal-body» из веб-скребка Pyppeteer?
Anonymous » » в форуме Python - 0 Ответы
- 28 Просмотры
-
Последнее сообщение Anonymous
-