nori/org.gnit.lucenekmp.analysis.ko.ct/BibleKoreanAnalyzer

BibleKoreanAnalyzer

class BibleKoreanAnalyzer(userDict: UserDictionary? = BibleKoreanUserDictionary.instance, mode: KoreanTokenizer.DecompoundMode = KoreanTokenizer.DEFAULT_DECOMPOUND, stopTags: Set<POS.Tag> = KoreanPartOfSpeechStopFilter.DEFAULT_STOP_TAGS, outputUnknownUnigrams: Boolean = false, stopWords: Set<String> = setOf("의")) : Analyzer

Analyzer for Korean that uses morphological analysis. Adds optional stop words (default includes the possessive particle "의").

Constructors

BibleKoreanAnalyzer

constructor(userDict: UserDictionary? = BibleKoreanUserDictionary.instance, mode: KoreanTokenizer.DecompoundMode = KoreanTokenizer.DEFAULT_DECOMPOUND, stopTags: Set<POS.Tag> = KoreanPartOfSpeechStopFilter.DEFAULT_STOP_TAGS, outputUnknownUnigrams: Boolean = false, stopWords: Set<String> = setOf("의"))

Properties

reuseStrategy

val reuseStrategy: Analyzer.ReuseStrategy

storedValue

var storedValue: CloseableThreadLocal<Any>?

Functions

open override fun close()

getOffsetGap

open fun getOffsetGap(fieldName: String?): Int

getPositionIncrementGap

open fun getPositionIncrementGap(fieldName: String?): Int

normalize

fun normalize(fieldName: String, text: String): BytesRef

tokenStream

fun tokenStream(fieldName: String, text: String): TokenStream

fun tokenStream(fieldName: String, reader: Reader): TokenStream