正题：Linux基本命令面试题：统计文件a.txt中“每个单词”的重复出现次数-Linux-爱易网页

正题：Linux基本命令面试题：统计文件a.txt中“每个单词”的重复出现次数

日期：2014-05-16　浏览次数：20738 次

主题：Linux基本命令面试题：统计文件a.txt中“每个单词”的重复出现次数
[请教]统计文件a.txt中“每个单词”的重复出现次数？若该文件大到几个G又该如何处理？

方案一：

#!/bin/sh

#定义源文件和临时文件
srcfile=word.txt
tempfile_words=tempfile_words
tempfile_words_uniq=tempfile_words_uniq

#取出所有单词，存入临时文件$tempfile_words，一行一个单词
#去除$tempfile_words中重复单词，并把换行符替换为空格，存入临时文件$tempfile_words_uniq
tr "[\015]" "[\n]"<$srcfile|sed 's/[^0-9a-zA-Z ]*$[0-9a-zA-Z]*$[^0-9a-zA-Z]*/\1\n/g'|sed '/^$/d'>$tempfile_words
sort $tempfile_words|uniq|tr "[\n]" "[ ]">$tempfile_words_uniq

#遍历所有单词，统计数目
words=$(cat $tempfile_words_uniq)
for word in $words
do
    word_num=$(grep $word $tempfile_words|wc -l)
    echo $word $word_num
done

方案二：

tr -s "\t| " "\n" <word.txt|sort|uniq -c

免责声明： 本文仅代表作者个人观点，与爱易网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

相关资料更多>

malloc（xx）解决方法

linux服务器批改端口映射

请强人介绍下在linux下qt的调试和测试。该怎么处理

救命！小弟我在root下不小心把一个用户删了，那里面有好多重要的资料！一学期的心血。

Linux修改时间跟日期的方法

Linux服务器登录后展示“-bash-3.2#”

设备驱动,该怎么处理

Linux零基础初级教程pdf,该怎么解决

putty远程链接上unix服务器，怎么操作安装在上面的PostgreSQL数据库

正题：Linux基本命令面试题：统计文件a.txt中“每个单词”的重复出现次数

相关资料更多>

推荐阅读更多>