Получите группы, которые вернули совпадение в Java Regex.

Получите группы, которые вернули совпадение в Java Regex. ⇐ JAVA

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Получите группы, которые вернули совпадение в Java Regex.

Цитата

Сообщение Anonymous » 01 окт 2024, 05:15

Я пишу простой лексер на Java, и класс выглядит так:

Код: Выделить всё

public class Lexer {
// This enum contains all the possible tokens accepted by the language and their respective regular expression
private enum PossibleTokens {
NUM("\\d+"),
SUM("\\+"),
SUB("-"),
MULT("\\*"),
DIV("/"),
LPAREN("\\("),
RPAREN("\\)");

public Pattern pattern;

private PossibleTokens (String ptrnString) {
pattern = Pattern.compile(ptrnString);
}
}
private String input;
private Pattern tokensPattern;

// Constructor for the Lexer class
public Lexer(String input) {
this.input = input;
this.tokensPattern = createTokensPattern();
}

private Pattern createTokensPattern() {
StringBuilder pattern = new StringBuilder();

// Creating tokens pattern using the token's name for a named-capturing group
for (PossibleTokens token : PossibleTokens.values()) {
pattern.append(String.format("|(?%s)", token.name(), token.pattern));
}

return Pattern.compile(pattern.substring(1));
}

// This is the main method of the class
public LinkedList tokenize() {
// Create a matcher for the input string
Matcher matcher = tokensPattern.matcher(input);

// Create an empty list for the result
LinkedList tokensList = new LinkedList();

// While matches are found, keep looping
while (matcher.find()) {
// Get match
String matchStr = matcher.group();

// Check witch token matched to create the apropriate Token object
for(PossibleTokens t : PossibleTokens.values()) {
if (matcher.group(t.name()) != null)
tokensList.add(new Token(t.name(), matchStr));
}
}

// Return list of Tokens
return tokensList;
}
}

Код работает так, как и ожидалось, но что мне не очень нравится в методе tokenize(), так это то, что для проверки того, какая группа совпала, мне нужно просмотреть все их и проверьте, какая из них не равна нулю.
Есть ли лучший способ получить совпадающую группу без необходимости перебирать все группы?
Это было бы очень полезно, потому что я планирую расширить количество токенов, которые принимает этот лексер, в будущем. Поэтому проверять каждую группу каждый раз было бы очень неэффективно.

Подробнее здесь: https://stackoverflow.com/questions/790 ... java-regex

1727748913

Anonymous

Я пишу простой лексер на Java, и класс выглядит так:
[code]public class Lexer {
// This enum contains all the possible tokens accepted by the language and their respective regular expression
private enum PossibleTokens {
NUM("\\d+"),
SUM("\\+"),
SUB("-"),
MULT("\\*"),
DIV("/"),
LPAREN("\\("),
RPAREN("\\)");

public Pattern pattern;

private PossibleTokens (String ptrnString) {
pattern = Pattern.compile(ptrnString);
}
}
private String input;
private Pattern tokensPattern;

// Constructor for the Lexer class
public Lexer(String input) {
this.input = input;
this.tokensPattern = createTokensPattern();
}

private Pattern createTokensPattern() {
StringBuilder pattern = new StringBuilder();

// Creating tokens pattern using the token's name for a named-capturing group
for (PossibleTokens token : PossibleTokens.values()) {
pattern.append(String.format("|(?%s)", token.name(), token.pattern));
}

return Pattern.compile(pattern.substring(1));
}

// This is the main method of the class
public LinkedList tokenize() {
// Create a matcher for the input string
Matcher matcher = tokensPattern.matcher(input);

// Create an empty list for the result
LinkedList tokensList = new LinkedList();

// While matches are found, keep looping
while (matcher.find()) {
// Get match
String matchStr = matcher.group();

// Check witch token matched to create the apropriate Token object
for(PossibleTokens t : PossibleTokens.values()) {
if (matcher.group(t.name()) != null)
tokensList.add(new Token(t.name(), matchStr));
}
}

// Return list of Tokens
return tokensList;
}
}
[/code]
Код работает так, как и ожидалось, но что мне не очень нравится в методе tokenize(), так это то, что для проверки того, какая группа совпала, мне нужно просмотреть все их и проверьте, какая из них не равна нулю.
[b]Есть ли лучший способ получить совпадающую группу без необходимости перебирать все группы?[/b]
Это было бы очень полезно, потому что я планирую расширить количество токенов, которые принимает этот лексер, в будущем. Поэтому проверять каждую группу каждый раз было бы очень неэффективно. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79041289/get-the-groups-that-returned-a-match-in-java-regex[/url]