src.core.tfidf package#

Submodules#

class src.core.tfidf.tfidf.TFIDF(config_dict)[source]#

Bases: BOW

A class to run TFIDF data preprocessing, training and inference

fit(text_ls=None, y=None)[source]#

Fits BOW algo on preprocessed text

Parameters:

text_ls (list, optional) – List of preprocessec strings, defaults to None
y (list, optional) – Labels, defaults to None

fit_transform(text_ls=None, y=None)[source]#

Fits and Transforms preprocessed text

Parameters:

text_ls (list, optional) – List of preprocessec strings, defaults to None
y (list, optional) – Labels, defaults to None

Returns:

Word vectors, Labels

Return type:

tuple (numpy.ndarray [num_samples, num_vocab], numpy.ndarray [num_samples, num_vocab])

get_idf(text_ls)[source]#

Creates Inverse Document Frequency array

get_tf(text_ls)[source]#

Creates Term Frequency array

save_output(X, y)[source]#

Saves Training and Inference results

Parameters:

transform(text_ls=None, y=None)[source]#

Transforms preprocessed text

Parameters:

text_ls (list, optional) – List of preprocessec strings, defaults to None
y (list, optional) – Labels, defaults to None

Returns:

Word vectors, Labels

Return type:

tuple (numpy.ndarray [num_samples, num_vocab], numpy.ndarray [num_samples, num_vocab])