«Java Apache Poi: не может получить строковое значение из числовой ячейки - как обрабатывать смешанные типы данных?»

«Java Apache Poi: не может получить строковое значение из числовой ячейки - как обрабатывать смешанные типы данных?» ⇐ JAVA

1 сообщение • Страница 1 из 1

Anonymous

«Java Apache Poi: не может получить строковое значение из числовой ячейки - как обрабатывать смешанные типы данных?»

Цитата

Сообщение Anonymous » 25 янв 2025, 15:32

В моем приложении Java я использую Apache POI для чтения данных из файла Excel. Структура данных состоит из трех столбцов следующего формата:

Столбец A: текст (например, коды продуктов)
Столбец B: текст (например, описания продуктов)
Столбец C: числовые значения (например, цены на продукты)

Однако, когда моя программа пытается прочитать данные, я сталкиваюсь с следующая ошибка:

Код: Выделить всё

Exception in thread "main" java.lang.IllegalStateException: Cannot get a STRING value from a NUMERIC cell
at org.apache.poi.xssf.usermodel.XSSFCell.typeMismatch(XSSFCell.java:984)
at org.apache.poi.xssf.usermodel.XSSFCell.getRichStringCellValue(XSSFCell.java:311)
at org.apache.poi.xssf.usermodel.XSSFCell.getStringCellValue(XSSFCell.java:280)
at com.example.ExcelReader.readExcel(ExcelReader.java:37)
at com.example.Main.main(Main.java:26)

Build.gradle

Код: Выделить всё

plugins {
id 'java'
id 'application'
id 'org.beryx.jlink' version '2.26.0'
}

application {
mainClass = 'com.example.Main'
}

group = 'com.example'
version = '1.0'

java {
sourceCompatibility = JavaVersion.VERSION_17
targetCompatibility = JavaVersion.VERSION_17
modularity.inferModulePath = true
}

ext.moduleName = 'com.example'

tasks.compileJava {
inputs.property('moduleName', moduleName)
doFirst {
options.compilerArgs = [
'--module-path', classpath.asPath
]
classpath = files()
}
}

tasks.withType(JavaCompile).configureEach {
options.encoding = 'UTF-8'
}

repositories {
mavenCentral()
}

dependencies {
implementation 'org.apache.pdfbox:pdfbox:2.0.30'
implementation 'org.apache.poi:poi-ooxml:5.3.0'
implementation 'org.apache.commons:commons-math3:3.6'
implementation 'org.apache.logging.log4j:log4j-core:2.20.0'
implementation 'org.apache.logging.log4j:log4j-api:2.20.0'

testImplementation platform('org.junit:junit-bom:5.10.3')
testImplementation 'org.junit.jupiter:junit-jupiter'
}

tasks.jar {
archiveBaseName = 'app'
}

tasks.register('copyDependencies', Copy) {
def outputDir = layout.buildDirectory.dir('libs')
from configurations.runtimeClasspath
into outputDir
}

jlink {
launcher {
name = 'my-app'
}
jpackage {
installerType = 'exe' // lub 'msi', 'dmg', 'pkg', 'deb', 'rpm'
installerOptions = [
'--description', 'Aplikacja do przetwarzania plików PDF i Excel',
'--vendor', 'MojaFirma',
'--win-per-user-install',
'--win-dir-chooser',
'--win-shortcut'
]
imageOptions = ['--icon', 'src/main/resources/icon.ico']
}
}

test {
useJUnitPlatform()
}
< /code>
 Excelreader.java
import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;

public class ExcelReader {
public static Map readExcel(String excelFilePath) throws IOException {
Map dataMap = new HashMap();
File file = new File(excelFilePath);

if (!file.exists()) {
throw new FileNotFoundException("Plik z danymi nie istnieje: " + excelFilePath);
}

try (FileInputStream fis = new FileInputStream(file);
Workbook workbook = new XSSFWorkbook(fis)) {
Sheet sheet = workbook.getSheetAt(0);
for (Row row : sheet) {
Cell keyCell = row.getCell(0);
Cell equivalentCell = row.getCell(1);
Cell priceCell = row.getCell(2);

// Logowanie typów danych każdej komórki
logCellType("IFS", keyCell);
logCellType("ILME", equivalentCell);
logCellType("Cena", priceCell);

if (keyCell != null && equivalentCell != null &&  priceCell != null) {
// Pobranie wartości z komórek
String keyValue = getCellValueAsString(keyCell).trim().replaceAll("\\s+", "");
String equivalentValue = getCellValueAsString(equivalentCell).trim();
String priceValue = getCellValueAsString(priceCell)
.replace(" zł", "").replace(",", ".").trim();

dataMap.put(keyValue, new String[]{equivalentValue, priceValue});
System.out.println("Read from Excel: " + keyValue + " -> " + equivalentValue + ", " + priceValue);
}
}
}
return dataMap;
}

private static String getCellValueAsString(Cell cell) {
if (cell == null) {
return "";
}
switch (cell.getCellType()) {
case STRING:
return cell.getStringCellValue().trim().replaceAll("\\s+", " ");
case NUMERIC:
if (DateUtil.isCellDateFormatted(cell)) {
return cell.getDateCellValue().toString();
} else {
return String.format("%.2f", cell.getNumericCellValue());
}
case BOOLEAN:
return String.valueOf(cell.getBooleanCellValue());
case FORMULA:
try {
return String.valueOf(cell.getNumericCellValue());
} catch (IllegalStateException e) {
return cell.getStringCellValue();
}
case BLANK:
default:
return "";
}
}

private static void logCellType(String columnName, Cell cell) {
if (cell == null) {
System.out.println(columnName + " column: EMPTY (null)");
return;
}

switch (cell.getCellType()) {
case STRING:
System.out.println(columnName + " column: STRING value -> " + cell.getStringCellValue());
break;
case NUMERIC:
System.out.println(columnName + " column: NUMERIC value -> " + cell.getNumericCellValue());
break;
case BOOLEAN:
System.out.println(columnName + " column: BOOLEAN value -> " + cell.getBooleanCellValue());
break;
case FORMULA:
System.out.println(columnName + " column: FORMULA value -> " + cell.getCellFormula());
break;
case BLANK:
System.out.println(columnName + " column: BLANK");
break;
default:
System.out.println(columnName + " column: UNKNOWN TYPE");
break;
}
}
}

1. , первая часть моего приложения, которая включает чтение и извлечение определенных шаблонов из файла .pdf, работает правильно. Программа успешно идентифицирует и извлекает необходимые последовательности символов, которые следуют за шаблоном XXXX-XXXX-XXX-XXX (где X представляет цифры) из файла PDF. >

Код: Выделить всё

import java.io.FileNotFoundException;
import java.io.IOException;
import java.util.List;
import java.util.Map;

public class Main {
public static void main(String[] args) {
if (args.length < 3) {
System.out.println(
"Użycie: java -jar my-app.jar 
  "
);
System.exit(1);
}

String inputFilePath = args[0];
String excelFilePath = args[1];
String outputFilePath = args[2];

try {
System.out.println("Rozpoczynam przetwarzanie pliku PDF...");
List foundPatterns = PDFProcessor.findPatternsInPDF(inputFilePath);

System.out.println("Odczytuję dane z pliku Excel...");
Map excelData = ExcelReader.readExcel(excelFilePath);

System.out.println("Zapisuję wyniki do pliku...");
FileWriterUtil.writeToFile(outputFilePath, foundPatterns, excelData);

System.out.println("Proces zakończony pomyślnie.");
} catch (FileNotFoundException e) {
System.err.println(e.getMessage());
} catch (IOException e) {
System.err.println("Błąd podczas przetwarzania plików: " + e.getMessage());
}
}
}

У меня есть две части моего приложения, которые работают правильно:
Обработка PDF (класс PDFProcessor):

Эта часть приложения успешно считывает и извлекает определенные
шаблоны из PDF-файла, используя шаблон регулярного выражения
\d{4}-\ д{4}-\d{3}-\d{3} (где x представляет собой цифры).
Извлеченные значения корректно протоколируются и передаются на следующий
этап обработки.

Запись файлов (класс FileWriterUtil):

Эта часть приложения работает должным образом.
Перед расширением приложения оно правильно создало выходной
файл и записало ожидаемые результаты (например, xxxx-xxxx-xxx-xxx, brak,
brak), где «brak» означает, что в
файле Excel не найдено соответствующих данных.

[Столбцы A, B и C содержат примеры данных:

Столбец A (A1): 1234-1234 -123-123 (текстовое значение в определенном формате).
Столбец B (B1): CDMA 1.0 (текстовое значение с числом).
Столбец C ( C1): 100,00 злотых (числовое значение в формате валюты с символом
"zł").

Столбцы E, F и G содержат формулы, проверяющие тип данных ячеек в столбцах A, B и C:

E1: ISTEXT(A1) → В ячейке F1 результат равен PRAWDA (ИСТИНА), указывая
что A1 — это текст.
E2: ISTEXT(B1) → В ячейке F2 результат — PRAWDA (TRUE), что указывает
на то, что B1 также является текстом.
E3: ISNUMBER(C1) → В ячейке F3 результатом является PRAWDA (ИСТИНА),
подтверждающее, что C1 распознается как числовое значение.

Столбец G содержит английские эквиваленты результатов, показывающие TRUE для всех проверок, что подтверждает, что формулы вернули ожидаемые результаты.]1

Подробнее здесь: https://stackoverflow.com/questions/793 ... -to-handle

1737808376

Anonymous

В моем приложении Java я использую Apache POI для чтения данных из файла Excel.  Структура данных состоит из трех столбцов следующего формата:
[list]
[*]Столбец A: текст (например, коды продуктов)
[*]Столбец B: текст (например, описания продуктов)
[*]Столбец C: числовые значения (например, цены на продукты)
[/list]
Однако, когда моя программа пытается прочитать данные, я сталкиваюсь с следующая ошибка:
[code]Exception in thread "main" java.lang.IllegalStateException: Cannot get a STRING value from a NUMERIC cell
at org.apache.poi.xssf.usermodel.XSSFCell.typeMismatch(XSSFCell.java:984)
at org.apache.poi.xssf.usermodel.XSSFCell.getRichStringCellValue(XSSFCell.java:311)
at org.apache.poi.xssf.usermodel.XSSFCell.getStringCellValue(XSSFCell.java:280)
at com.example.ExcelReader.readExcel(ExcelReader.java:37)
at com.example.Main.main(Main.java:26)
[/code]
Build.gradle
[code]plugins {
id 'java'
id 'application'
id 'org.beryx.jlink' version '2.26.0'
}

application {
mainClass = 'com.example.Main'
}

group = 'com.example'
version = '1.0'

java {
sourceCompatibility = JavaVersion.VERSION_17
targetCompatibility = JavaVersion.VERSION_17
modularity.inferModulePath = true
}

ext.moduleName = 'com.example'

tasks.compileJava {
inputs.property('moduleName', moduleName)
doFirst {
options.compilerArgs = [
'--module-path', classpath.asPath
]
classpath = files()
}
}

tasks.withType(JavaCompile).configureEach {
options.encoding = 'UTF-8'
}

repositories {
mavenCentral()
}

dependencies {
implementation 'org.apache.pdfbox:pdfbox:2.0.30'
implementation 'org.apache.poi:poi-ooxml:5.3.0'
implementation 'org.apache.commons:commons-math3:3.6'
implementation 'org.apache.logging.log4j:log4j-core:2.20.0'
implementation 'org.apache.logging.log4j:log4j-api:2.20.0'

testImplementation platform('org.junit:junit-bom:5.10.3')
testImplementation 'org.junit.jupiter:junit-jupiter'
}

tasks.jar {
archiveBaseName = 'app'
}

tasks.register('copyDependencies', Copy) {
def outputDir = layout.buildDirectory.dir('libs')
from configurations.runtimeClasspath
into outputDir
}

jlink {
launcher {
name = 'my-app'
}
jpackage {
installerType = 'exe' // lub 'msi', 'dmg', 'pkg', 'deb', 'rpm'
installerOptions = [
'--description', 'Aplikacja do przetwarzania plików PDF i Excel',
'--vendor', 'MojaFirma',
'--win-per-user-install',
'--win-dir-chooser',
'--win-shortcut'
]
imageOptions = ['--icon', 'src/main/resources/icon.ico']
}
}

test {
useJUnitPlatform()
}
< /code>
 Excelreader.java
import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;

public class ExcelReader {
public static Map readExcel(String excelFilePath) throws IOException {
Map dataMap = new HashMap();
File file = new File(excelFilePath);

if (!file.exists()) {
throw new FileNotFoundException("Plik z danymi nie istnieje: " + excelFilePath);
}

try (FileInputStream fis = new FileInputStream(file);
Workbook workbook = new XSSFWorkbook(fis)) {
Sheet sheet = workbook.getSheetAt(0);
for (Row row : sheet) {
Cell keyCell = row.getCell(0);
Cell equivalentCell = row.getCell(1);
Cell priceCell = row.getCell(2);

// Logowanie typów danych każdej komórki
logCellType("IFS", keyCell);
logCellType("ILME", equivalentCell);
logCellType("Cena", priceCell);

if (keyCell != null && equivalentCell != null &&  priceCell != null) {
// Pobranie wartości z komórek
String keyValue = getCellValueAsString(keyCell).trim().replaceAll("\\s+", "");
String equivalentValue = getCellValueAsString(equivalentCell).trim();
String priceValue = getCellValueAsString(priceCell)
.replace(" zł", "").replace(",", ".").trim();

dataMap.put(keyValue, new String[]{equivalentValue, priceValue});
System.out.println("Read from Excel: " + keyValue + " -> " + equivalentValue + ", " + priceValue);
}
}
}
return dataMap;
}

private static String getCellValueAsString(Cell cell) {
if (cell == null) {
return "";
}
switch (cell.getCellType()) {
case STRING:
return cell.getStringCellValue().trim().replaceAll("\\s+", " ");
case NUMERIC:
if (DateUtil.isCellDateFormatted(cell)) {
return cell.getDateCellValue().toString();
} else {
return String.format("%.2f", cell.getNumericCellValue());
}
case BOOLEAN:
return String.valueOf(cell.getBooleanCellValue());
case FORMULA:
try {
return String.valueOf(cell.getNumericCellValue());
} catch (IllegalStateException e) {
return cell.getStringCellValue();
}
case BLANK:
default:
return "";
}
}

private static void logCellType(String columnName, Cell cell) {
if (cell == null) {
System.out.println(columnName + " column: EMPTY (null)");
return;
}

switch (cell.getCellType()) {
case STRING:
System.out.println(columnName + " column: STRING value -> " + cell.getStringCellValue());
break;
case NUMERIC:
System.out.println(columnName + " column: NUMERIC value -> " + cell.getNumericCellValue());
break;
case BOOLEAN:
System.out.println(columnName + " column: BOOLEAN value -> " + cell.getBooleanCellValue());
break;
case FORMULA:
System.out.println(columnName + " column: FORMULA value -> " + cell.getCellFormula());
break;
case BLANK:
System.out.println(columnName + " column: BLANK");
break;
default:
System.out.println(columnName + " column: UNKNOWN TYPE");
break;
}
}
}
[/code]
[b] 1. [/b], первая часть моего приложения, которая включает чтение и извлечение определенных шаблонов из файла .pdf, работает правильно. Программа успешно идентифицирует и извлекает необходимые последовательности символов, которые следуют за шаблоном XXXX-XXXX-XXX-XXX (где X представляет цифры) из файла PDF.  >
[code]import java.io.FileNotFoundException;
import java.io.IOException;
import java.util.List;
import java.util.Map;

public class Main {
public static void main(String[] args) {
if (args.length < 3) {
System.out.println(
"Użycie: java -jar my-app.jar 
  "
);
System.exit(1);
}

String inputFilePath = args[0];
String excelFilePath = args[1];
String outputFilePath = args[2];

try {
System.out.println("Rozpoczynam przetwarzanie pliku PDF...");
List foundPatterns = PDFProcessor.findPatternsInPDF(inputFilePath);

System.out.println("Odczytuję dane z pliku Excel...");
Map excelData = ExcelReader.readExcel(excelFilePath);

System.out.println("Zapisuję wyniki do pliku...");
FileWriterUtil.writeToFile(outputFilePath, foundPatterns, excelData);

System.out.println("Proces zakończony pomyślnie.");
} catch (FileNotFoundException e) {
System.err.println(e.getMessage());
} catch (IOException e) {
System.err.println("Błąd podczas przetwarzania plików: " + e.getMessage());
}
}
}
[/code]
У меня есть две части моего приложения, которые работают правильно:
[b]Обработка PDF (класс PDFProcessor):[/b]
[list]
[*]Эта часть приложения успешно считывает и извлекает определенные
шаблоны из PDF-файла, используя шаблон регулярного выражения
\d{4}-\ д{4}-\d{3}-\d{3} (где x представляет собой цифры).
[*]Извлеченные значения корректно протоколируются и передаются на следующий
этап обработки.
[/list]
[b]Запись файлов (класс FileWriterUtil):[/b]
[list]
[*]Эта часть приложения работает должным образом.
[*]Перед расширением приложения оно правильно создало выходной
файл и записало ожидаемые результаты (например, xxxx-xxxx-xxx-xxx, brak,
brak), где «brak» означает, что в
файле Excel не найдено соответствующих данных.
[/list]
[Столбцы A, B и C содержат примеры данных:
[list]
[*]Столбец A (A1): 1234-1234 -123-123 (текстовое значение в определенном формате).
[*]Столбец B (B1): CDMA 1.0 (текстовое значение с числом).
[*]Столбец C ( C1): 100,00 злотых (числовое значение в формате валюты с символом
"zł").
[/list]
Столбцы E, F и G содержат формулы, проверяющие тип данных ячеек в столбцах A, B и C:
[list]
[*]E1: ISTEXT(A1) → В ячейке F1 результат равен PRAWDA (ИСТИНА), указывая
что A1 — это текст.
[*]E2: ISTEXT(B1) → В ячейке F2 результат — PRAWDA (TRUE), что указывает
на то, что B1 также является текстом.[*]E3: ISNUMBER(C1) → В ячейке F3 результатом является PRAWDA (ИСТИНА),
подтверждающее, что C1 распознается как числовое значение.
[/list]
Столбец G содержит английские эквиваленты результатов, показывающие TRUE для всех проверок, что подтверждает, что формулы вернули ожидаемые результаты.]1 

Подробнее здесь: [url]https://stackoverflow.com/questions/79386714/java-apache-poi-cannot-get-a-string-value-from-a-numeric-cell-how-to-handle[/url]