本文概述
要安装Tika, 我们可以根据需要使用几种方法。下面给出了一些常见的安装选项。
- 来源发布
- Maven依赖
- 命令行实用程序
注意:Tika 1.18需要Java 7或更高版本才能实现。
1.来源发布
首先访问Apache Tike的官方网站, 然后从那里下载最新版本。下载后, 我们可以使用它的库在我们的应用程序中实现。
Tika版本包含以下组件。
组件 | 描述 |
---|---|
tika-core/target/tika-core-*.jar | 它是包含核心类和接口的核心库。 |
tika-parsers/target/tika-parsers-*.jar | 这是一个Tika解析器库。它包含基于外部库实现Tika Parser接口的类。 |
tika-app/target/tika-app-*.jar | Tika应用程序, 它是具有图形用户界面和命令行界面的可运行jar。 |
tika-server/target/tika-server-*.jar | 它包含Tika JAX-RS REST应用程序。 |
tika-bundle/target/tika-bundle-*.jar | 它是一个OSGI捆绑软件, 其中包含带有非OSGified解析器库的tika解析器。它使它们易于在OSGI环境上进行部署。 |
tika-eval/target/tika-eval-*.jar | 它提供了一个命令行工具来评估Tika的输出。 |
2.为了在Maven项目中实现Tika, 我们可以在pom.xml文件中使用以下依赖项。
<dependencies>
<dependency>
<groupId>org.apache.tika</groupId>
<artifactId>tika-core</artifactId>
<version>1.18</version>
</dependency>
<dependency>
<groupId>org.apache.tika</groupId>
<artifactId>tika-parsers</artifactId>
<version>1.18</version>
</dependency>
3.命令行实用程序
除了源代码, 我们还可以从官方网站下载jar文件。该文件是可运行的, 可以使用以下命令运行。
java -jar tika-app-1.18.jar --gui
此命令将打开一个如下所示的GUI窗口:
评论前必须登录!
注册