我已经找了两天了,还没有找到答案。
我已经在运行tomcat6的Ubuntu服务器上从repos安装了solr,并添加了solr-cell jar和tika库。
我可以运行对某些pdf文件有效的curl命令,并对它们进行索引,但对其他文件无效。起初,我认为一些文件已损坏,但事实似乎并非如此。在我看来,那些不起作用的和不起作用的没有什么大的区别。
我得到的错误是一个500错误- see example here
我发出的curl请求是:
$ curl 'http://mysolrserver.com:port/solr/update/extract?map.content=text&map.stream_name=id&extractOnly=true&commit=true' -F "file=@/absolute/path/to/file.pdf"这确实适用于某些PDF,但不适用于其他PDF。
我相信我已经安装了solr 1.4.0。
任何帮助都将不胜感激-谢谢
--编辑--我正在使用Ubuntu 10.04.1,如果有帮助的话。
https://stackoverflow.com/questions/5943613
复制相似问题