Я пытаюсь написать анализатор Spacy, чтобы извлечь имена и условия контракта.[{"label": "seller", "pattern": [{"ENT_TYPE": "PERSON", "OP": "{1,2}"}, { "OP": "*"}, {"TEXT": "seller"}]},
{"label": "buyer", "pattern": [{"ENT_TYPE": "PERSON", "OP": "{1,2}"}, { "OP": "*"}, {"TEXT": "buyer"}]},]
< /code>
, что приводит к пролетам, например: < /p>
span seller Text: john e. smith and wife judy c. smith, seller
span seller Text: e. smith and wife judy c. smith, seller
span seller Text: smith and wife judy c. smith, seller
span seller Text: judy c. smith, seller
span seller Text: c. smith, seller
span seller Text: smith, seller
< /code>
Похоже, что Spacy Chunging the Person. Как я могу создать правило, которое соответствует нескольким продавцам (или покупателям), но не сокращает их, как этот пример? < /P>
Мой код ниже. < /P>
#!/usr/bin/env python3
import spacy
from spacy.tokens import SpanGroup, DocBin, Span
from spacy import displacy
import bodytext
import sys
rules = [{"label": "seller", "pattern": [{"ENT_TYPE": "PERSON", "OP": "{1,2}"}, { "OP": "*"}, {"TEXT": "seller"}]},
{"label": "buyer", "pattern": [{"ENT_TYPE": "PERSON", "OP": "{1,2}"}, { "OP": "*"}, {"TEXT": "buyer"}]},]
nlp = spacy.load("en_core_web_lg")
ruler = nlp.add_pipe("span_ruler")
ruler.add_patterns(rules)
text = "THIS AGREEMENT made on this 12 day of December, 2008, between John E. Smith and wife Judy C. Smith, Seller (whether one or more), whose address is: 1234 CRD 5000, midland, Texas, 79221-2016, and real estate investors, LLC, Buyer, whose address is: 4321 Harvard Ave, Midland, Texas 79701. "
doc = nlp(text.lower())
doc.spans["test"] = SpanGroup(doc)
db = DocBin()
for sentence in doc.sents:
for span in doc.spans["ruler"]:
print("span "+ span.label_+" Text: "+span.text)
if span.start >= sentence.start and span.end
Подробнее здесь: https://stackoverflow.com/questions/794 ... efore-text
Правила SPACY Соответствуют объектам перед текстом ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Почему Presidio с Spacy NLP Engine не распознает организации и Pesel, пока Spacy делает?
Anonymous » » в форуме Python - 0 Ответы
- 16 Просмотры
-
Последнее сообщение Anonymous
-