130

我有一个 bash shell 脚本,它遍历某个目录的所有子目录(但不是文件)。问题是某些目录名称包含空格。

这是我的测试目录的内容:

$ls -F test
Baltimore/  Cherry Hill/  Edison/  New York City/  Philadelphia/  cities.txt

以及遍历目录的代码:

for f in `find test/* -type d`; do
  echo $f
done

这是输出:

测试/巴尔的摩
测试/樱桃
爬坡道
测试/爱迪生
测试/新
约克
城市
测试/费城

樱桃山和纽约市被视为 2 或 3 个单独的条目。

我尝试引用文件名,如下所示:

for f in `find test/* -type d | sed -e 's/^/\"/' | sed -e 's/$/\"/'`; do
  echo $f
done

但无济于事。

必须有一个简单的方法来做到这一点。


下面的答案很棒。但是为了使这更复杂 - 我并不总是想使用我的测试目录中列出的目录。有时我想将目录名称作为命令行参数传递。

我接受了查尔斯关于设置 IFS 的建议,并提出了以下建议:

dirlist="${@}"
(
  [[ -z "$dirlist" ]] && dirlist=`find test -mindepth 1 -type d` && IFS=$'\n'
  for d in $dirlist; do
    echo $d
  done
)

除非命令行参数中有空格(即使引用了这些参数),否则这很好用。例如,像这样调用脚本:test.sh "Cherry Hill" "New York City"会产生以下输出:

樱桃
爬坡道
新的
约克
城市
4

20 回答 20

107

首先,不要那样做。最好的方法是find -exec正确使用:

# this is safe
find test -type d -exec echo '{}' +

另一种安全的方法是使用 NUL 终止列表,但这需要您的 find 支持-print0

# this is safe
while IFS= read -r -d '' n; do
  printf '%q\n' "$n"
done < <(find test -mindepth 1 -type d -print0)

您还可以从 find 中填充一个数组,然后再传递该数组:

# this is safe
declare -a myarray
while IFS= read -r -d '' n; do
  myarray+=( "$n" )
done < <(find test -mindepth 1 -type d -print0)
printf '%q\n' "${myarray[@]}" # printf is an example; use it however you want

如果您的 find 不支持-print0,那么您的结果就是不安全的——如果存在名称中包含换行符的文件(是的,这是合法的),则以下内容将不会按预期运行:

# this is unsafe
while IFS= read -r n; do
  printf '%q\n' "$n"
done < <(find test -mindepth 1 -type d)

如果不打算使用上述方法之一,第三种方法(在时间和内存使用方面效率较低,因为它在进行分词之前读取子进程的整个输出)是使用IFS不'不包含空格字符。关闭通配符 ( set -f) 以防止包含通配符的字符串,例如[],*或被?扩展:

# this is unsafe (but less unsafe than it would be without the following precautions)
(
 IFS=$'\n' # split only on newlines
 set -f    # disable globbing
 for n in $(find test -mindepth 1 -type d); do
   printf '%q\n' "$n"
 done
)

最后,对于命令行参数情况,如果您的 shell 支持数组(即 ksh、bash 或 zsh),您应该使用数组:

# this is safe
for d in "$@"; do
  printf '%s\n' "$d"
done

会保持分离。请注意,引用(以及使用$@而不是$*)很重要。数组也可以通过其他方式填充,例如 glob 表达式:

# this is safe
entries=( test/* )
for d in "${entries[@]}"; do
  printf '%s\n' "$d"
done
于 2008-11-19T05:19:41.220 回答
28
find . -type d | while read file; do echo $file; done

但是,如果文件名包含换行符,则不起作用。以上是我知道的唯一解决方案,当您实际上想要在变量中包含目录名称时。如果您只想执行某些命令,请使用 xargs。

find . -type d -print0 | xargs -0 echo 'The directory is: '
于 2008-11-19T05:21:19.343 回答
24

这是一个处理文件名中的制表符和/或空格的简单解决方案。如果您必须处理文件名中的其他奇怪字符(如换行符),请选择另一个答案。

测试目录

ls -F test
Baltimore/  Cherry Hill/  Edison/  New York City/  Philadelphia/  cities.txt

进入目录的代码

find test -type d | while read f ; do
  echo "$f"
done

"$f"如果用作参数,则文件名必须用引号 ( ) 括起来。如果没有引号,则空格充当参数分隔符,并为调用的命令提供多个参数。

和输出:

test/Baltimore
test/Cherry Hill
test/Edison
test/New York City
test/Philadelphia
于 2009-09-23T09:01:43.937 回答
7

这在标准 Unix 中非常棘手,并且大多数解决方案都会与换行符或其他字符发生冲突。但是,如果您使用的是 GNU 工具集,那么您可以利用该find选项-print0并使用xargs相应的选项-0(减零)。有两个字符不能出现在简单的文件名中;这些是斜杠和 NUL '\0'。显然,斜杠出现在路径名中,因此使用 NUL '\0' 标记名称结尾的 GNU 解决方案是巧妙且万无一失的。

于 2008-11-19T05:45:43.553 回答
5

您可以暂时使用 IFS(内部字段分隔符):

OLD_IFS=$IFS     # Stores Default IFS
IFS=$'\n'        # Set it to line break
for f in `find test/* -type d`; do
    echo $f
done

IFS=$OLD_IFS

<!>

于 2016-03-09T08:05:00.857 回答
4

不要将列表存储为字符串;将它们存储为数组以避免所有这些分隔符混淆。这是一个示例脚本,它可以对 test 的所有子目录或在其命令行上提供的列表进行操作:

#!/bin/bash
if [ $# -eq 0 ]; then
        # if no args supplies, build a list of subdirs of test/
        dirlist=() # start with empty list
        for f in test/*; do # for each item in test/ ...
                if [ -d "$f" ]; then # if it's a subdir...
                        dirlist=("${dirlist[@]}" "$f") # add it to the list
                fi
        done
else
        # if args were supplied, copy the list of args into dirlist
        dirlist=("$@")
fi
# now loop through dirlist, operating on each one
for dir in "${dirlist[@]}"; do
        printf "Directory: %s\n" "$dir"
done

现在让我们在一个带有一两条曲线的测试目录上尝试一下:

$ ls -F test
Baltimore/
Cherry Hill/
Edison/
New York City/
Philadelphia/
this is a dirname with quotes, lfs, escapes: "\''?'?\e\n\d/
this is a file, not a directory
$ ./test.sh 
Directory: test/Baltimore
Directory: test/Cherry Hill
Directory: test/Edison
Directory: test/New York City
Directory: test/Philadelphia
Directory: test/this is a dirname with quotes, lfs, escapes: "\''
'
\e\n\d
$ ./test.sh "Cherry Hill" "New York City"
Directory: Cherry Hill
Directory: New York City
于 2009-04-27T18:50:45.280 回答
4

为什么不直接放

IFS='\n'

在 for 命令前面?这会将字段分隔符从 <Space><Tab><Newline> 更改为 <Newline>

于 2012-02-26T11:07:26.427 回答
4
find . -print0|while read -d $'\0' file; do echo "$file"; done
于 2012-03-15T16:38:49.033 回答
4

我用

SAVEIFS=$IFS
IFS=$(echo -en "\n\b")
for f in $( find "$1" -type d ! -path "$1" )
do
  echo $f
done
IFS=$SAVEIFS

这还不够吗?
想法取自http://www.cyberciti.biz/tips/handling-filenames-with-spaces-in-bash.html

于 2012-06-10T14:26:06.370 回答
3

ps如果它只是关于输入中的空间,那么一些双引号对我来说很顺利......

read artist;

find "/mnt/2tb_USB_hard_disc/p_music/$artist" -type f -name *.mp3 -exec mpg123 '{}' \;
于 2012-11-03T23:48:30.950 回答
2

补充一下乔纳森所说的:使用以下-print0选项find结合xargs

find test/* -type d -print0 | xargs -0 command

command这将使用正确的参数执行命令;带有空格的目录将被正确引用(即它们将作为一个参数传入)。

于 2008-11-19T05:53:32.853 回答
1

也必须处理路径名中的空格。我最后做的是使用递归和for item in /path/*

function recursedir {
    local item
    for item in "${1%/}"/*
    do
        if [ -d "$item" ]
        then
            recursedir "$item"
        else
            command
        fi
    done
}
于 2009-07-10T18:52:01.463 回答
1
#!/bin/bash

dirtys=()

for folder in *
do    
 if [ -d "$folder" ]; then    
    dirtys=("${dirtys[@]}" "$folder")    
 fi    
done    

for dir in "${dirtys[@]}"    
do    
   for file in "$dir"/\*.mov   # <== *.mov
   do    
       #dir_e=`echo "$dir" | sed 's/[[:space:]]/\\\ /g'`   -- This line will replace each space into '\ '   
       out=`echo "$file" | sed 's/\(.*\)\/\(.*\)/\2/'`     # These two line code can be written in one line using multiple sed commands.    
       out=`echo "$out" | sed 's/[[:space:]]/_/g'`    
       #echo "ffmpeg -i $out_e -sameq -vcodec msmpeg4v2 -acodec pcm_u8 $dir_e/${out/%mov/avi}"    
       `ffmpeg -i "$file" -sameq -vcodec msmpeg4v2 -acodec pcm_u8 "$dir"/${out/%mov/avi}`    
   done    
done

上面的代码会将 .mov 文件转换为 .avi。.mov 文件位于不同的文件夹中,文件夹名称也有空格。我上面的脚本会将 .mov 文件转换为同一文件夹中的 .avi 文件。不知道对大家有没有帮助。

案子:

[sony@localhost shell_tutorial]$ ls
Chapter 01 - Introduction  Chapter 02 - Your First Shell Script
[sony@localhost shell_tutorial]$ cd Chapter\ 01\ -\ Introduction/
[sony@localhost Chapter 01 - Introduction]$ ls
0101 - About this Course.mov   0102 - Course Structure.mov
[sony@localhost Chapter 01 - Introduction]$ ./above_script
 ... successfully executed.
[sony@localhost Chapter 01 - Introduction]$ ls
0101_-_About_this_Course.avi  0102_-_Course_Structure.avi
0101 - About this Course.mov  0102 - Course Structure.mov
[sony@localhost Chapter 01 - Introduction]$ CHEERS!

干杯!

于 2010-11-18T11:54:02.500 回答
1

将文件列表转换为 Bash 数组。这使用了 Matt McClure 从 Bash 函数返回数组的方法:http: //notes-matthewlmcclure.blogspot.com/2009/12/return-array-from-bash-function-v-2.html 结果是一种方法将任何多行输入转换为 Bash 数组。

#!/bin/bash

# This is the command where we want to convert the output to an array.
# Output is: fileSize fileNameIncludingPath
multiLineCommand="find . -mindepth 1 -printf '%s %p\\n'"

# This eval converts the multi-line output of multiLineCommand to a
# Bash array. To convert stdin, remove: < <(eval "$multiLineCommand" )
eval "declare -a myArray=`( arr=(); while read -r line; do arr[${#arr[@]}]="$line"; done; declare -p arr | sed -e 's/^declare -a arr=//' ) < <(eval "$multiLineCommand" )`"

for f in "${myArray[@]}"
do
   echo "Element: $f"
done

即使存在错误字符,这种方法似乎也有效,并且是将任何输入转换为 Bash 数组的通用方法。缺点是如果输入很长,您可能会超过 Bash 的命令行大小限制,或者会占用大量内存。

最终在列表上运行的循环也将列表通过管道输入的方法的缺点是读取标准输入并不容易(例如要求用户输入),并且循环是一个新过程,因此您可能想知道为什么变量循环结束后,您在循环内设置的内容不可用。

我也不喜欢设置 IFS,它会弄乱其他代码。

于 2012-09-17T21:10:41.297 回答
1

好吧,我看到太多复杂的答案。我不想传递 find 实用程序的输出或编写循环,因为 find 对此有“exec”选项。

我的问题是我想将所有带有 dbf 扩展名的文件移动到当前文件夹,其中一些包含空格。

我是这样解决的:

 find . -name \*.dbf -print0 -exec mv '{}'  . ';'

对我来说看起来很简单

于 2016-04-11T12:54:30.230 回答
0

刚刚发现我的问题和你的问题有一些相似之处。显然,如果您想将参数传递给命令

test.sh "Cherry Hill" "New York City"

按顺序打印出来

for SOME_ARG in "$@"
do
    echo "$SOME_ARG";
done;

注意 $@ 被双引号包围,这里有一些注释

于 2009-05-25T09:12:04.490 回答
0

我需要相同的概念来顺序压缩某个文件夹中的几个目录或文件。我已经解决了使用 awk 从 ls 解析列表并避免名称中出现空格的问题。

source="/xxx/xxx"
dest="/yyy/yyy"

n_max=`ls . | wc -l`

echo "Loop over items..."
i=1
while [ $i -le $n_max ];do
item=`ls . | awk 'NR=='$i'' `
echo "File selected for compression: $item"
tar -cvzf $dest/"$item".tar.gz "$item"
i=$(( i + 1 ))
done
echo "Done!!!"

你怎么看?

于 2013-08-24T19:46:24.747 回答
0
find Downloads -type f | while read file; do printf "%q\n" "$file"; done
于 2016-01-15T09:55:28.027 回答
-3

对我来说,这很有效,而且非常“干净”:

for f in "$(find ./test -type d)" ; do
  echo "$f"
done
于 2011-07-13T04:28:12.357 回答
-4

只是有一个简单的变体问题...将类型为 .flv 的文件转换为 .mp3(打哈欠)。

for file in read `find . *.flv`; do ffmpeg -i ${file} -acodec copy ${file}.mp3;done

递归查找所有 Macintosh 用户 flash 文件并将它们转换为音频(复制,无转码)......就像上面的 while,注意 read 而不是只是 'for file in ' 会转义。

于 2010-04-21T19:19:28.247 回答