import fitz
doc = fitz.open("2303.11366v4.pdf")# download from https://arxiv.org/pdf/2303.11366
print(doc[2].get_text().split('Figure 1')[0])
< /code>
Я получил этот текст: < /p>
@7DVNFOHDQVRPHSDQDQGSXW
LWLQFRXQWHUWRS
'HFLVLRQPDNLQJ
7DVN@RIRSHQ
RUFORVH
SDUHQWKHVHVRQO\>@
3URJUDPPLQJ
7DVN:KDWSURIHVVLRQGRHV-RKQ
/DQFKHVWHUDQG$ODQ'HDQ)RVWHU
KDYHLQFRPPRQ"
5HDVRQLQJ
>@
$FWLRQWDNHSDQIURPVWRYHEXUQHU
2EV1RWKLQJKDSSHQV>@
$FWLRQFOHDQSDQZLWKVLQNEDVLQ
2EV1RWKLQJKDSSHQV>@
7KLQN>@QRYHOLVWMRXUQDOLVW
FULWLF>@QRYHOLVW
VFUHHQZULWHU>@FRPPRQLV
QRYHOLVWDQGVFUHHQZULWHU
$FWLRQ²QRYHOLVWVFUHHQZULWHU³
GHIPDWFKBSDUHQVOVW
LIVFRXQW
VFRXQW
VFRXQW
VFRXQW
>@
UHWXUQ
1R
6HOIJHQHUDWHGXQLWWHVWVIDLO
DVVHUWPDWFKBSDUHQV
(QYLURQPHQW%LQDU\5HZDUG
5XOH/0+HXULVWLF
+DOOXFLQDWLRQ
>@IDLOHGEHFDXVH,LQFRUUHFWO\
DVVXPHGWKDWWKH\ERWKKDGWKH
VDPHPXOWLSOHSURIHVVLRQV>@
DFFXUDWHO\LGHQWLI\LQJWKHLU
SURIHVVLRQV
>@ZURQJEHFDXVHLWRQO\FKHFNV
LIWKHWRWDOFRXQWRIRSHQDQG
FORVHSDUHQWKHVHVLVHTXDO>@
RUGHURIWKHSDUHQWKHVHV>@
>@WULHGWRSLFNXSWKHSDQLQ
VWRYHEXUQHU>@EXWWKHSDQ
ZDVQRWLQVWRYHEXUQHU>@
>@
UHWXUQ
@6RWKHSURIHVVLRQ
-RKQ/DQFKHVWHUDQG$ODQ'HDQ
)RVWHUKDYHLQFRPPRQLVQRYHOLVW
$FWLRQ²QRYHOLVW³
>@$FWLRQWDNHSDQIURP
VWRYHEXUQHU
>@2EV Я попробовал различные пакеты с питоном, но все они привели к искаженному тексту. />[code]1. - You are in the middle of a room.
2. [TASKCLEANSOMEDANANDPUTITINCOUNTERTOP] - The task is to clean a pan and put it on the countertop.
3. [DECISIONMAKING] - This section is about decision making.
4. [TASKYOUAREGIVENALISTOFTWOSTRINGSOFOPEN ORCLOSEPARENTHESESONLY[]] - The task is to work with a list of two strings of open or close parentheses.
5. [PROGRAMMING] - This section is about programming.
6. [TASKWHATPROFESSIONDOESJOHNLANCHESTERANDALANDEANFOSTERHAVEINCOMMON?] - The task is to determine what profession John Lanchesterand Alan Dean Foster have in common.
.....
Этот текст из Claude haiku.
Но мне нужно перевести текст на человеческий язык с помощью Python.
Я читаю файл PDF с помощью Python, а часть контента отображается как строка искаженного текста. Как мне его восстановить? < /P> [code]import fitz doc = fitz.open("2303.11366v4.pdf")# download from https://arxiv.org/pdf/2303.11366 print(doc[2].get_text().split('Figure 1')[0]) < /code> Я получил этот текст: < /p> @7DVNFOHDQVRPHSDQDQGSXW LWLQFRXQWHUWRS 'HFLVLRQPDNLQJ 7DVN@RIRSHQ
5XOH/0+HXULVWLF +DOOXFLQDWLRQ >@IDLOHGEHFDXVH,LQFRUUHFWO\ DVVXPHGWKDWWKH\ERWKKDGWKH VDPHPXOWLSOHSURIHVVLRQV>@ DFFXUDWHO\LGHQWLI\LQJWKHLU SURIHVVLRQV >@ZURQJEHFDXVHLWRQO\FKHFNV LIWKHWRWDOFRXQWRIRSHQDQG FORVHSDUHQWKHVHVLVHTXDO>@ RUGHURIWKHSDUHQWKHVHV>@ >@WULHGWRSLFNXSWKHSDQLQ VWRYHEXUQHU>@EXWWKHSDQ ZDVQRWLQVWRYHEXUQHU>@ >@ UHWXUQ @6RWKHSURIHVVLRQ -RKQ/DQFKHVWHUDQG$ODQ'HDQ )RVWHUKDYHLQFRPPRQLVQRYHOLVW $FWLRQ²QRYHOLVW³ >@$FWLRQWDNHSDQIURP VWRYHEXUQHU >@2EV Я попробовал различные пакеты с питоном, но все они привели к искаженному тексту. />[code]1. - You are in the middle of a room.
2. [TASKCLEANSOMEDANANDPUTITINCOUNTERTOP] - The task is to clean a pan and put it on the countertop.
3. [DECISIONMAKING] - This section is about decision making.
4. [TASKYOUAREGIVENALISTOFTWOSTRINGSOFOPEN ORCLOSEPARENTHESESONLY[]] - The task is to work with a list of two strings of open or close parentheses.
5. [PROGRAMMING] - This section is about programming.
6. [TASKWHATPROFESSIONDOESJOHNLANCHESTERANDALANDEANFOSTERHAVEINCOMMON?] - The task is to determine what profession John Lanchesterand Alan Dean Foster have in common. ..... [/code] Этот текст из Claude haiku. Но мне нужно перевести текст на человеческий язык с помощью Python.
Я использую jspdf с jspdf-autotable, чтобы генерировать отчет о правом к леле (RTL) PDF на арабском языке.
Все работает отлично, но заголовки кажутся искаженными /испорченными текстами вместо правильных арабских персонажей.
const...
Я разрабатываю приложение Flutter, которое прекрасно работает в режиме отладки и на нескольких устройствах (например, Samsung и Redmi). Однако, когда я строю выпуск APK и запускаю его на REALME RMX1921 (Android 11), я сталкиваюсь с странной...
Я разрабатываю приложение Flutter, которое прекрасно работает в режиме отладки и на нескольких устройствах (например, Samsung и Redmi). Однако, когда я строю выпуск APK и запускаю его на REALME RMX1921 (Android 11), я сталкиваюсь с странной...
Для Apache Pdfbox API я использую шрифт Unicode с именем Arial Unicode MS, чтобы установить значение для поля формы PDF.
PDFont unicodeFont = null;
// Get Unicode font for signing the non english languages in pdf
try (InputStream stream =...