假设我有一个很长的文本,我想提取一个特定单词的一定长度的上下文。例如,在下面的文本中,我想提取围绕战士这个词的8个单词。
.
.
..。死了。他是一个非常勇敢的战士,为自由而战.
.
.
在这种情况下,结果将是
他是一个非常勇敢的战士,为自由而战。
请注意我是如何删除“死”这个词的,因为我更希望从一个完整句子的开头开始,以及我是如何提取超过8个单词的,因为fight for freedom比仅仅争取更有意义。
是否有任何算法,或进行的研究,在这个领域,我可以遵循?我该如何着手处理这个问题。
发布于 2016-08-13 08:59:38
发布于 2019-06-20 11:14:44
让我们将您的问题分成几个部分,并将其与任何编程语言保持独立:
希望这能有所帮助。
https://stackoverflow.com/questions/38930871
复制相似问题