[Common Lisp] 程式設計教學：處理命令列參數 (Command Line Arguments)

前言

在撰寫命令列程式時，處理命令列參數是常見的任務。程式設計者在剛學程式設計時，寫的程式也都是命令列程式。所以，處理命令列參數是程式設計者在學習初期就會碰到的任務。

然而，在 Common Lisp 實作品中，取得命令列參數的方式並不一致。與其在每個命令列程式中重覆解決這項無法避開的議題，還不如將這個問題封裝成跨平台的函式，日後就以相同的方式來解決。本文介紹在常見的 Common Lisp 實作品中處理命令列參數的方式。

以跨平台的方式取得命令列參數

在 Common Lisp 程式中，命令列參數的型態是列表 (list)。由於列表本身即儲存長度和符號的資訊，不需要再用額外的變數來取得命令列參數相關的資訊。 (註)

(註) 在 C 語言中，命令列參數儲在 argc (長度) 和 argv (字串陣列) 兩個變數中。但 Common Lisp 的列表即同時具有這兩項資訊。

但不同 Common Lisp 實作品取得命令列參數列表的變數相異。故我們把呼叫命令列參數的過程封裝在 argument-vector 函式中。其程式碼如下：

(defun argument-vector ()
  (declare (ftype (function () list) argument-vector))
  "Unprocessed argv (argument vector)"
  #+sbcl   sb-ext:*posix-argv*
  #+ccl    ccl:*command-line-argument-list*
  #+clisp  ext:*args*
  #+abcl   ext:*command-line-argument-list*
  #+ecl    (ext:command-args)
  #-(or sbcl ccl clisp abcl ecl)
    (error "Unsupported Common Lisp implementation"))

其實這個函式的動作很簡單，只是在呼叫 Common Lisp 實作品的內建變數而已。比較關鍵的點在於這個函式會因應不同 Common Lisp 實作品呼叫不同的變數。

呼叫這個函式後，即可取得命令列參數。但這並沒有解決本文所討論的議題，因為每個 Common Lisp 實作品回傳的命令列參數的內容也不一致。我們會在下一節繼續討論這個議題。

初步處理命令列參數的 Common Lisp 程式

承上節，由於每種 Common Lisp 實作品回傳的命令列參數的內容不一致，我們得先把多餘的部分去除。參考以下函式：

(defun argument-script ()
  (declare (ftype (function () list) argument-vector))
  "Processed command-line argument(s) in scripting mode."
  (let* ((args (argument-vector))
         #+sbcl   (args (rest args))
         #+ccl    (args (rest (rest (rest (rest (rest (rest args)))))))
         #+abcl   (args (rest args))
         #+ecl    (args (rest (rest (rest args))))
         ;; In CLISP, no loading script in argument(s).
        )
    (cons *load-truename* args)))

這個函式根據不同的 Common Lisp 實作品，多次使用 rest 函式去除多餘的參數。最後使用 cons 將 Common Lisp 命令稿名稱 (*load-truename* 變數) 和參數接起來後回傳，就可以得到標準化的命令列參數。

請讀者不要死背這個函式。這個函式的操作是根據實測而撰寫的。以下是用來實測的範例程式：

(load "cl-yautils.lisp")

(use-package :cl-yautils)

(defun main ()
  ; Print out unprocessed argument vector.
  (write-line "Unprocessed argument vector:")
  (puts (argument-vector))

  (write-line "")  ; Separator.

  ; Print out processed argument(s).
  (write-line "Processed argument(s) in scripting mode:")
  (puts (argument-script))
  (finish-output)
  (quit-with-status))

(main)

在這個範例中，argument-vector 函式和 argument-script 函式都已經實作好了。這兩個函式的實作如同上文所列。

我們假定該 Common Lisp 程式以腳本模式 (scripting mode) 來使用。以下是假想的指令：

$ interpreter --load args.lisp a b c

實際的指令會根據 Common Lisp 實作品略有差異。

使用 SBCL (Steel Bank CL) 時，處理參數的程式會壓縮成單一參數 sbcl。所以，只要去除一個參數即可：

> sbcl --noinform --script examples\args.lisp a b c
Unprocessed argument(s):
(sbcl a b c)

Processed argument(s):
(C:/Users/user/Documents/cl-yautils/examples/args.lisp a b c)

使用 Clozure CL 時，處理參數的程式會如實印出。所以，要去除六個參數：

> wx86cl64.exe --load examples\args.lisp -- a b c
Unprocessed argument(s):
(wx86cl64.exe --load examples\args.lisp -- a b c)

Processed argument(s):
(C:/Users/user/Documents/cl-yautils/examples/args.lisp a b c)

在命令列參數中，-- 是有意義的。詳見下文。

使用 ECL (Embeddable CL) 時，不需加 --。所以，會有三個額外的參數：

> ecl -shell examples\args.lisp a b c
;;; Loading "C:/Users/user/Documents/cl-yautils/cl-yautils.lisp"
Unprocessed argument(s):
(ecl -shell examples\args.lisp a b c)

Processed argument(s):
(C:/Users/user/Documents/cl-yautils/examples/args.lisp a b c)

使用 CLISP 時，不需在參數加 --。此外，CLISP 會自動吞吃掉多餘的參數，在我們的函式中就不需處理了：

> clisp examples\args.lisp a b c
Unprocessed argument(s):
(a b c)

Processed argument(s):
(C:\Users\user\Documents\cl-yautils\examples\args.lisp a b c)

使用 ABCL (Armed Bear CL) 時，需要在參數加 --。但 ABCL 會自動吞吃掉多餘的參數，包括 --：

> abclrun.bat examples\args.lisp -- a b c
Unprocessed argument(s):
(a b c)

Processed argument(s):
(C:/Users/user/Documents/cl-yautils/examples/args.lisp a b c)

在本節中，我們展示了常見的五種 Common Lisp 實作品處理參數的方式。讀者可藉此了解不同實作品在處理參數上的差異。在實作函式時，就不需死背函式的指令，可以用合理的方式撰寫函式。

若把 Common Lisp 命令稿編譯成執行檔，處理命令列參數的方式會改變。所以，我們保留原始的命令列參數列表，以因應不同情境的變化。

細心的讀者會發現，有時候我們得在參數中加 --，有時候則不需要。這牽涉到 Common Lisp 實作品的行為。詳見下一節。

是誰在處理命令列參數？

當 Common Lisp 原始碼當成命令稿來呼叫時，實際上會有兩隻程式來處理參數。一個是 Common Lisp 實作品本身，另一個則是 Common Lisp 命令稿。由於 Common Lisp 實作品位於指令的第一個位置，命令列參數處理的方式是由 Common Lisp 實作品來決定。

以 SBCL 來說，當呼叫 Common Lisp 命令稿後，後續的參數會自動轉由該命令稿執行。所以，不需要加 --：

> sbcl --noinform --load examples\args.lisp a b c

然而，使用 Clozure CL 呼叫 Common Lisp 命令稿時，一律由 Clozure CL 來處理參數。為了要把參數導給 Common Lisp 命令稿，得用 -- 做為分隔線：

> wx86cl64.exe --load examples\args.lisp -- a b c

對於撰寫 Common Lisp 命令稿的程式設計者來說，會希望命令列參數由該命令稿來處理，而非由 Common Lisp 實作品來處理。但對該 Common Lisp 命令稿的使用者來說，加入 -- 不是自然的使用方式。此外，這樣的指令太長了，不容易記憶。

著眼於這個議題，可以用命令列腳本 (command-line script) 做為 wrapper 來封裝呼叫指令的方式。Common Lisp 命令稿的使用者就不需記憶參數的特殊使用方式。由於 Unix 和 Windows 的命令列腳本語言相異。我們會分別對這兩種腳本語言撰寫 wrapper。

Unix 平台適用的 POSIX Shell 腳本

在 Unix (註) 上，最常見的 shell 是 Bash。但 POSIX shell 的可攜性較好，且 Bash 向後相容 POSIX shell。此外，有些 BSD 或商用 Unix 預設不一定會用 Bash，但至少會有 POSIX shell。所以，我們仍然使用 POSIX shell 來寫 wrapper。

(註) 包括 macOS、GNU/Linux、BSD、商用 Unix 等。

以下是此腳本的使用範例：

$ args sbcl a b c

以下是該 wrapper 的參考實作：

#!/bin/sh

usage () {
  local stream=$1;

  if [ -z "$stream" ];
  then
    stream="1";
  fi

  echo "Usage: $0 [lisp] [param] ..." >&"$stream";
  echo "" >&"$stream";
  echo "Valid Common Lisp implementation:" >&"$stream";
  echo "  sbcl" >&"$stream";
  echo "  ccl" >&"$stream";
  echo "  clisp" >&"$stream";
  echo "  ecl" >&"$stream";
  echo "  abcl" >&"$stream";
}

# Constants
SBCL="sbcl"
CCL="ccl"
CLISP="clisp"
ECL="ecl"
ABCL="abcl"

lisp=$1;

if [ "-h" = "$lisp" ] || [ "--help" = "$lisp" ];
then
  echo "Use \`$0 usage\` or \`$0 help\` to show help info";
  exit;
fi

if [ "usage" = "$lisp" ] || [ "help" = "$lisp" ];
then
  usage;
  exit;
fi

case $lisp in
  "$SBCL")
    shift;
    ;;
  "$CCL")
    shift;
    ;;
  "$CLISP")
    shift;
    ;;
  "$ECL")
    shift;
    ;;
  "$ABCL")
    shift;
    ;;
  *)
    echo "Unsupported Common Lisp implementation" >&2;
    usage 2;
    exit 1;
esac

# Locate the path of the script itself.
root=$(dirname "$0");

if [ "$SBCL" = "$lisp" ];
then
  # Check whether SBCL and its wrapper exist.
  if ! command -v sbclrun 2>/dev/null 1>&2;
  then
    echo "No SBCL or its wrapper on the system" >&2;
    exit 1;
  fi

  # Invoke SBCL wrapper.
  sbclrun "$root/args.lisp" "$@";
elif [ "$CCL" = "$lisp" ];
then
  # Check whether Clozure CL and its wrapper exist.
  if ! command -v ccl 2>/dev/null 1>&2;
  then
    echo "No Clozure CL or its wrapper on the system" >&2;
    exit 1;
  fi

  # Invoke Clozure CL wrapper.
  cclrun "$root/args.lisp" -- "$@";
elif [ "$CLISP" = "$lisp" ];
then
  # Check whether CLISP exists.
  if ! command -v clisp --version 2>/dev/null 1>&2;
  then
    echo "No CLISP on the system" >&2;
    exit 1;
  fi

  # Invoke CLISP directly.
  clisp "$root/args.lisp" "$@";
elif [ "$ECL" = "$lisp" ];
then
  # Check whether ECL exists.
  if ! command -v ecl --help 2>/dev/null 1>&2;
  then
    echo "No ECL on the system" >&2;
    exit 1;
  fi

  # Invoke ECL directly.
  if [ "Darwin" = $(uname) ];
  then
    ecl --shell "$root/args.lisp" "$@";
  else
    ecl -shell "$root/args.lisp" "$@";
  fi
elif [ "$ABCL" = "$lisp" ];
then
  # Check whether ABCL and its wrapper exist.
  if ! command -v abcl 2>/dev/null 1>&2;
  then
    echo "No ABCL or its wrapper on the system" >&2;
    exit 1;
  fi

  # Invoke ABCL wrapper.
  abclrun "$root/args.lisp" -- "$@";
fi

一開始是簡易的說明文件。我們希望腳本使用者可在不閱讀腳本原始碼的前提下就會用該腳本。

在呼叫特定 Common Lisp 實作品前，要先以 POSIX shell 腳本簡單地處理一下命令列參數，篩出 lisp 旗標，才能知道要呼叫那一個 Common Lisp 實作品。

由於第一個參數已經被 wrapper 用掉了，所以要用 shift 吞吃掉該參數。剩下的參數則會原封不動地傳到 Common Lisp 命令稿上。Wrapper 只是過水的小程式，實際上參數還是要帶給 Common Lisp 命令稿。

可以注意一下我們會針對特定的 Common Lisp 實作品加上 -- 來分隔參數。由於此 wrapper 已經封裝呼叫 Common Lisp 命令稿的指令，使用者在使用 wrapper 時不需要針對不同 Common Lisp 實作品使用不同的參數。

Windows 平台適用的 Batch 腳本

Windows 原生的腳本語言有四種 (註) 。在這四者之中，Batch 腳本是最古老的，相容性也最好。能夠用 Batch 腳本完成的任務，就不要用新的腳本語言來寫，以得到最佳的相容性。

(註) 有 Batch、VBScript、JScript、PowerShell。

使用此腳本的範例如下：

> args.bat sbcl a b c

此 wrapper 的參考實作如下：

@echo off

rem Constants
set sbcl="sbcl"
set ccl="ccl"
set clisp="clisp"
set ecl="ecl"
set abcl="abcl"

rem Get the name of the script itself.
set self=%~n0%~x0

rem Get the root path of current batch script.
set rootdir=%~dp0

rem Get first argument.
set lisp=%1

if "" == "%lisp%" goto hint
if "/?" == "%lisp%" goto hint

if "usage" == "%lisp%" goto usage
if "help" == "%lisp%" goto usage

if %sbcl% == "%lisp%" goto runlisp
if %ccl% == "%lisp%" goto runlisp
if %clisp% == "%lisp%" goto runlisp
if %ecl% == "%lisp%" goto runlisp
if %abcl% == "%lisp%" goto runlisp

echo Unsupported Common Lisp implementation
exit /B 1

:hint
echo Use `%self% usage` or `%self% help` to show help info
exit /B 0

:usage
echo Usage: %self% [lisp] [param] ...
echo.
echo Valid Common Lisp implementation:
echo   sbcl
echo   ccl
echo   clisp
echo   ecl
echo   abcl
exit /B 0

:runlisp
rem Consume first argument.
shift

rem Collect remaining argument(s).
set args=
:collect_args
set arg=%1
shift
if "" neq "%arg%" set args=%args% %arg% && goto collect_args

rem Run specific Common Lisp implementation.
if %sbcl% == "%lisp%" goto runsbcl
if %ccl% == "%lisp%" goto runccl
if %clisp% == "%lisp%" goto runclisp
if %ecl% == "%lisp%" goto runecl
if %abcl% == "%lisp%" goto runabcl

rem Fallback as some error message.
echo Unknown Common Lisp implementation
exit /B 1

:runsbcl
sbclrun %rootdir%args.lisp %args%
exit /B 0

:runccl
cclrun %rootdir%args.lisp -- %args%
exit /B 0

:runclisp
clisp %rootdir%args.lisp %args%
exit /B 0

:runecl
ecl -shell %rootdir%args.lisp %args%
exit /B 0

:runabcl
abclrun %rootdir%args.lisp -- %args%
exit /B 0

一開始是此腳本的簡易說明文件。我們希望腳本使用者可在不看腳本原始碼的前提下就會用這個腳本。

此 wrapper 使用變數 lisp 做為旗標。再根據該旗標的設定來呼叫相對應的 Common Lisp 實作品。由於 Common Lisp 實作品本身是跨平台軟體，在 Unix 和 Windows 上使用相同的參數，所以呼叫的方式是雷同的。

由於 Batch 的語法所帶來的限制，我們在程式中使用較多的 goto。在一般性的程式設計中，不會常使用 goto。但 Batch 為了相容性因素，不會改語法。我們只能把程式碼儘量寫得結構化一點。

本腳本的中段使用 goto 模擬迴圈以收集剩餘的命令列參數。網路上比較少見這種用法，有興趣的讀者可以看一下。

繼續處理命令列參數

在收集到標準化的命令列參數後，只能算是完成前半段的任務。後半段的任務就是拆解命令列參數，根據程式使用者輸入的參數來決定程式實際的行為。

拆解命令列參數算是不大不小的任務，其實不一定要使用函式庫，除非是碰到比較複雜的情境。

Common Lisp 的命令列參數的資料型態是列表，可以在 loop 迴圈中利用 pop 巨集逐一吞吃參數，然後再寫 cond 或其他選擇控制結構來控制程式實際的行為。以下是 Common Lisp 虛擬碼：

(loop
  (let ((arg (pop args)))
    #|Use `arg` here.|#))

由於每個程式所需的參數相異，此處不逐一解說。

附記

本文所用的範例程式和 wrapper 存放在 cl-portable 專案中。

關於作者

身為資訊領域碩士，位元詩人 (ByteBard) 認為開發應用程式的目的是為社會帶來價值。如果在這個過程中該軟體能成為永續經營的項目，那就是開發者和使用者雙贏的局面。

位元詩人喜歡用開源技術來解決各式各樣的問題，但必要時對專有技術也不排斥。閒暇之餘，位元詩人將所學寫成文章，放在這個網站上和大家分享。