Frequent Distribution sorted by frequency


 1 import nltk
 2 
 3 def freq_sorted(text,ranklimit):
 4     fd=nltk.FreqDist(text)
 5     cumulative = 0.0
 6     for rank, (word,freq) in enumerate(sorted(fd.items(), key=lambda x: (-1*x[1], x[0]))[:ranklimit]):
 7         cumulative += fd[word] * 100 / fd.N()
 8         print "%3d %6.2f%% %s" % (rank+1, cumulative, word)
 9 
10 def test_freq_sorted():
11     freq_sorted(nltk.corpus.brown.words(),15)

结果为:

  1   5.00% the
  2  10.00% ,
  3  14.00% .
  4  17.00% of
  5  19.00% and
  6  21.00% to
  7  22.00% a
  8  23.00% in
  9  23.00% that
 10  23.00% is
 11  23.00% was
 12  23.00% for
 13  23.00% ``
 14  23.00% ''
 15  23.00% The

优质内容筛选与推荐>>
1、java-linux-nginx安装
2、struts2配置通用action一个顶N个,你还在写一大堆action吗?
3、Qt 中一些常用类中文说明
4、vm 安装 vcenter 本主要记录选择l现有的受支持数据库
5、南京邮电大学网络攻防平台WEB题


长按二维码向我转账

受苹果公司新规定影响,微信 iOS 版的赞赏功能被关闭,可通过二维码转账支持公众号。

    阅读
    好看
    已推荐到看一看
    你的朋友可以在“发现”-“看一看”看到你认为好看的文章。
    已取消,“好看”想法已同步删除
    已推荐到看一看 和朋友分享想法
    最多200字,当前共 发送

    已发送

    朋友将在看一看看到

    确定
    分享你的想法...
    取消

    分享想法到看一看

    确定
    最多200字,当前共

    发送中

    网络异常,请稍后重试

    微信扫一扫
    关注该公众号





    联系我们

    欢迎来到TinyMind。

    关于TinyMind的内容或商务合作、网站建议,举报不良信息等均可联系我们。

    TinyMind客服邮箱:support@tinymind.net.cn