from estnltk import Text #t = Text("Juku ja Mati tulid roomsalt Tallinna Ulikooli, Jaagup Kippari poolt antava XML rakenduste praktikumi keset tanast jahedat hiliskevadist paeva") #andmed = t.get.word_texts.lemmas.postags.as_dataframe #andmed["pikkus"]=list(map(len, andmed.word_texts)) #print(andmed) #print(andmed.groupby(["postags"]).pikkus.mean()) t2=Text(open("../javakys.txt", encoding="utf-8").read()) andmed = t2.get.word_texts.lemmas.postags.as_dataframe andmed["pikkus"]=list(map(len, andmed.word_texts)) print(andmed.groupby(["postags"]).postags.count()) print(andmed.groupby(["postags"]).pikkus.mean()) print(andmed.groupby(["postags"]).pikkus.std()) import matplotlib matplotlib.use('Agg') andmed[andmed.postags == "S"].pikkus.hist().get_figure().savefig("joonis3.png") andmed[andmed.postags == "S"].boxplot(column="pikkus", by="postags").get_figure().savefig("joonis4.png")