Код: Выделить всё
"Once there was a (so-called) rock. it.,was not! in fact, a big rock."
Код: Выделить всё
["Once", " ", "there", " ", "was", " ", "a", ",", "so", " ", "called", ",", "rock", ".", "it", ".", "was", " ", "not", ".", "in", " ", "fact", ",", "a", " ", "big", " ", "rock"]
Код: Выделить всё
spaceDelimiters = " -_"
commaDelimiters = ",():;\""
periodDelimiters = ".!?"
Я дошел до того, что смог удалить все символы-разделители, но мне нужно, чтобы они были отдельными частями массив. А также существует иерархия, в которой точки переопределяют запятые, а не пробелы.
Может быть, мой подход просто неправильный? Вот что у меня есть:
Код: Выделить всё
def split(string, delimiters):
regex_pattern = '|'.join(map(re.escape, delimiters))
return re.split(regex_pattern, string)
Подробнее здесь: https://stackoverflow.com/questions/792 ... cters-with
Мобильная версия