#! /bin/bash

if [ $# -lt 1 ]; then
    echo "Bruk: $0 <input-pdf>"  
    echo "Dette scriptet krever pdftk, pdftohtml, mktemp, perl og grep"
    echo "Det tar en inputfil (eksport fra sendregning), deler denne opp"
    echo "og gir filene navn på formatet {fakturadato (YYYY-MM-DD)}-ut-faktura-{fakturanummer}.pdf"
    echo "Det oppretter også en fil mapping-files.txt som skal appendes til mappingfilen"
    exit
fi

pdftk "$1" burst

T=$(mktemp)
M=$(mktemp)
for PDF in pg_*.pdf; do
    pdftohtml -i -stdout "$PDF" > "$T"
    K=$(cat $T | grep -m 1 -o -P 'Kreditnota: (\d{4})' | grep -o -P '\d{4}')
    D=$(cat $T | grep -o -P 'Fakturadato: \d{2}.\d{2}.\d{2}' | uniq | grep -o -P '\d{2}.\d{2}.\d{2}' | perl -e '$d=<STDIN>; $d =~ s/(..).(..).(..)/20$3-$2-$1/; print $d;')
    F=$(cat $T | grep -o -P 'Faktura: \d{4}' | grep -o -P '\d{4}')
    KF=$?
    if [ $KF -eq 0 ]; then
        N="$F"
    else
        N="$K"
    fi
    NAVN="$D-ut-faktura-$N.pdf"
    mv $PDF "$D-ut-faktura-$N.pdf"
    echo "${D:0:4} $NAVN S$N" >> "$M"
done;
mv "$M" mapping-files.txt
rm "$T" doc_data.txt
