除了我们从Tika官方站点下载的源代码之外, 还提供了Jar文件。该文件是可运行的应用程序, 可运行具有图形用户界面的tika应用程序。
它为用户提供了一个界面, 并允许拖放文件以获取提取的内容。
要实现它, 如果不是从官方站点下载的, 请下载jar。下载后, 使用以下命令运行它。
运行Tika应用程序
找到下载的Jar文件位置, 然后使用终端执行命令。
$ java -jar tika-app-1.18.jar
执行命令后, 它显示以下用户界面, 这意味着我们的Tika应用程序正在运行。
现在, 我们可以将文档拖到该界面, 它将立即显示内容和元数据。参见示例。
假设我们正在拖放一个包含以下内容的文档文件。
//文件内容
Apache Tika安装
要安装Tika, 我们可以根据需要使用几种方法。下面提供了一些常见的安装选项。
- 来源发布
- Maven依赖
- 命令行实用程序
注意:Tika 1.18需要Java 7或更高版本才能实现。
输出
// metadata
// content
评论前必须登录!
注册