]> git.cameronkatri.com Git - mandoc.git/log
mandoc.git
6 years agoRename mandoc_getarg() to roff_getarg() and pass it the roff parser
Ingo Schwarze [Fri, 21 Dec 2018 17:15:18 +0000 (17:15 +0000)]
Rename mandoc_getarg() to roff_getarg() and pass it the roff parser
struct as an argument such that after copy-in, it can call roff_expand()
once again, which used to be called roff_res() before this.  This
fixes a subtle low-level roff(7) parsing bug reported by Fabio
Scotoni <fabio at esse dot ch> in the 4.4BSD-Lite2 mdoc.samples(7)
manual page, because that page used an escaped escape sequence in
a macro argument.

To expand escaped escape sequences in quoted mdoc(7) arguments, too,
stop bypassing the call to roff_getarg() in mdoc_argv.c, function args()
for this case.  This does not solve the case of escaped escape sequences
in quoted .Bl -column phrases yet.

Because roff_expand() can make the string longer, roff_getarg() can no
longer operate in-place but needs to malloc(3) the returned string.
In the high-level parsers, free(3) that string after processing it.

6 years agoMove the full responsibility for reporting open(2) errors from
Ingo Schwarze [Thu, 20 Dec 2018 21:30:32 +0000 (21:30 +0000)]
Move the full responsibility for reporting open(2) errors from
mparse_open() to the caller.  That is better because only the caller
knows its preferred reporting method and format and only the caller
has access to all the data that should be included - like the column
number in .so processing or the current manpath in makewhatis(8).
Moving the mandoc_msg() call out is possible because the caller can
call strerror(3) just as easily as mparse_open() can.

Move mandoc_msg_setinfilename() closer to the parsing of the file
contents, to avoid problems *with* the file (like non-existence,
lack of permissions, etc.) getting misreported as problems *in*
the file.

Fix the column number reported for .so failure:
let it point to the beginning of the filename.

Taken together, this prevents makewhatis(8) from spewing confusing
messages about .so failures to stderr, a bug reported by
Raf Czlonka <rczlonka at gmail dot com> on ports@.

It also prevents mandoc(1) from issuing *two* messages for every
single .so failure.

6 years agoExplain what the fields in mandoc messages mean,
Ingo Schwarze [Thu, 20 Dec 2018 18:24:12 +0000 (18:24 +0000)]
Explain what the fields in mandoc messages mean,
rather than merely specifying the message syntax.
Gap in documentation found while looking at a bug
report from Raf Czlonka <rczlonka at gmail dot com>.

6 years agoBugfix:
Ingo Schwarze [Thu, 20 Dec 2018 03:41:54 +0000 (03:41 +0000)]
Bugfix:
When after a \\, \t, or \a, another \t or \a had to be resolved
in copy mode within the same argument, the argument got corrupted.
Found while working on a loosely related bug report
from Fabio Scotoni <fabio at esse dot ch>.

6 years agoAs a first step towards making roff_res() callable from mandoc_getarg(),
Ingo Schwarze [Tue, 18 Dec 2018 22:00:02 +0000 (22:00 +0000)]
As a first step towards making roff_res() callable from mandoc_getarg(),
move the function mandoc_getarg() from mandoc.c to roff.c.  It was
misplaced in mandoc.c in the first place; that file is intended for
utilities needed both by parsers and by formatters, while reading
macro arguments in copy mode is purely a task of the roff(7) parser.
Needed as a preliminary for an upcoming bugfix.
No code change.

6 years agoThe .HP macro was deprecated by groff, and that makes sense
Ingo Schwarze [Sun, 16 Dec 2018 02:21:00 +0000 (02:21 +0000)]
The .HP macro was deprecated by groff, and that makes sense
because it serves no real purpose and works poorly with HTML.
While here, describe the section argument of .TH,
clarify the syntax display of .TP, and polish some wordings.

6 years agominor polishing, in parts related to functional improvements in the past,
Ingo Schwarze [Sun, 16 Dec 2018 01:34:56 +0000 (01:34 +0000)]
minor polishing, in parts related to functional improvements in the past,
and also adding some cross references for important escape sequences

6 years agos/OpenBSD/Id/ in CVS Ids
Ingo Schwarze [Sun, 16 Dec 2018 00:21:05 +0000 (00:21 +0000)]
s/OpenBSD/Id/ in CVS Ids

6 years agoYet another round of improvements to manual font selection.
Ingo Schwarze [Sun, 16 Dec 2018 00:17:02 +0000 (00:17 +0000)]
Yet another round of improvements to manual font selection.

Unify handling of \f and .ft.
Support \f4 (bold+italic).
Support ".ft BI" and ".ft CW" for terminal output.
Support the .ft request in HTML output.
Reject the bogus fonts \f(C1, \f(C2, \f(C3, and \f(CP.
In regress.pl, only strip leading whitespace in math mode.

6 years agoSeveral improvements to escape sequence handling.
Ingo Schwarze [Sat, 15 Dec 2018 19:30:25 +0000 (19:30 +0000)]
Several improvements to escape sequence handling.

* Add the missing special character \_ (underscore).
* Partial implementations of \a (leader character)
and \E (uninterpreted escape character).
* Parse and ignore \r (reverse line feed).
* Add a WARNING message about undefined escape sequences.
* Add an UNSUPP message about unsupported escape sequences.
* Mark \! and \? (transparent throughput)
and \O (suppress output) as unsupported.
* Treat the various variants of zero-width spaces as one-byte escape
sequences rather than as special characters, to avoid defining bogus
forms with square brackets.
* For special characters with one-byte names, do not define bogus
forms with square brackets, except for \[-], which is valid.
* In the form with square brackets, undefined special characters do not
fall back to printing the name verbatim, not even for one-byte names.
* Starting a special character name with a blank is an error.
* Undefined escape sequences never abort formatting of the input
string, not even in HTML output mode.
* Document the newly handled escapes, and a few that were missing.
* Regression tests for most of the above.

6 years agozap trailing whitespace; from jmc@
Ingo Schwarze [Fri, 14 Dec 2018 20:40:24 +0000 (20:40 +0000)]
zap trailing whitespace; from jmc@

6 years agoCleanup, no functional change:
Ingo Schwarze [Fri, 14 Dec 2018 06:33:14 +0000 (06:33 +0000)]
Cleanup, no functional change:
Now that message handling is properly encapsulated,
remove struct mparse pointers from four structs (roff, roff_man,
tbl_node, eqn_node) and from the argument lists of five functions
(roff_alloc, roff_man_alloc, mandoc_getarg, tbl_alloc, eqn_alloc).
Except for being passed to the main program as an opaque object,
it now only occurs in read.c, as it should, and not across 15 files
like in the past.

6 years agoAlmost mechanical diff to remove the "struct mparse *" argument
Ingo Schwarze [Fri, 14 Dec 2018 05:18:02 +0000 (05:18 +0000)]
Almost mechanical diff to remove the "struct mparse *" argument
from mandoc_msg(), where it is no longer used.
While here, rename mandoc_vmsg() to mandoc_msg() and retire the
old version:  There is really no point in having another function
merely to save "%s" in a few places.
Minus 140 lines of code.

6 years agoFold mparse_parse_buffer() into mparse_readfd(), making the code
Ingo Schwarze [Fri, 14 Dec 2018 02:16:21 +0000 (02:16 +0000)]
Fold mparse_parse_buffer() into mparse_readfd(), making the code
considerably more readable.  This is possible now that i finally
deleted mparse_readmem() from mandoc portable - an unused function
that never existed in OpenBSD.

This cleanup already made me find a minor bug: after a recursive
parse, restoring the line number of the parent file was forgotten.
This is fixed now.

6 years agoDelete the function mparse_readmem() that has been unused for almost a
Ingo Schwarze [Fri, 14 Dec 2018 01:24:49 +0000 (01:24 +0000)]
Delete the function mparse_readmem() that has been unused for almost a
decade but regularly makes maintenance harder.  Mandoc is not a
general-purpose library, and being as pluggable as possible is not
among the goals of the project.

6 years agoMajor cleanup; may imply minor changes in edge cases of error reporting.
Ingo Schwarze [Fri, 14 Dec 2018 01:18:25 +0000 (01:18 +0000)]
Major cleanup; may imply minor changes in edge cases of error reporting.

Finally, drop support for the run-time configurable mandocmsg()
callback.  It was over-engineered from the start, never used for
anything in a decade, and repeatedly caused maintenance headaches.

Consolidate reporting infrastructure into two files, mandoc.h and
mandoc_msg.c, mopping up the bits and pieces that were scattered
around main.c, read.c, mandoc_parse.h, libmandoc.h, the prototypes
of four parsing-related functions, and both parser structs.

6 years agoCleanup, no functional change:
Ingo Schwarze [Thu, 13 Dec 2018 11:55:46 +0000 (11:55 +0000)]
Cleanup, no functional change:
Split the top level parser interface out of the utility header
mandoc.h, into a new header mandoc_parse.h, for use in the main
program and in the main parser only.
Move enum mandoc_os into roff.h because struct roff_man is the
place where it is stored.
This allows removal of mandoc.h from seven files in low-level
parsers and in formatters.

6 years agolibmdoc.h no longer needs mdoc.h
Ingo Schwarze [Thu, 13 Dec 2018 07:30:21 +0000 (07:30 +0000)]
libmdoc.h no longer needs mdoc.h

6 years agoCleanup, no functional change:
Ingo Schwarze [Thu, 13 Dec 2018 07:28:27 +0000 (07:28 +0000)]
Cleanup, no functional change:
Finally merge the pointless file st.in into st.c.
Nobody should do operating systems dependent changes to standards:
By definition, standards are the same for every operating system.
While here, libmdoc.h no longer requires mdoc.h.

6 years agoCleanup, no functional change:
Ingo Schwarze [Thu, 13 Dec 2018 06:18:20 +0000 (06:18 +0000)]
Cleanup, no functional change:
Move the roffhash_*() functions from roff.h to roff_int.h
because they are only intended for use by parsers,
neither by main programs nor by formatters.

6 years agoCleanup, no functional change:
Ingo Schwarze [Thu, 13 Dec 2018 05:23:37 +0000 (05:23 +0000)]
Cleanup, no functional change:
No need to expose the eqn(7) syntax tree data structures everywhere.
Move them to their own include file, "eqn.h".
While here, delete the unused enum eqn_pilet.

6 years agoCleanup, no functional change:
Ingo Schwarze [Thu, 13 Dec 2018 03:40:13 +0000 (03:40 +0000)]
Cleanup, no functional change:
In libroff.h, nothing was left except the eqn(7) parser interface, which
isn't really part of the roff(7) parser, so rename it to eqn_parse.h.

While here, move struct eqn_def to eqn.c because that's the only
file using it, and let eqn_box_free() and eqn_free() handle NULL.

6 years agoCleanup, no functional change:
Ingo Schwarze [Thu, 13 Dec 2018 02:06:07 +0000 (02:06 +0000)]
Cleanup, no functional change:
Move tbl(7)-specific parser internals out of libroff.h.
Move some tbl(7)-internal processing from roff.c to tbl.c.

6 years agoCleanup, no functional change:
Ingo Schwarze [Wed, 12 Dec 2018 21:54:35 +0000 (21:54 +0000)]
Cleanup, no functional change:
No need to expose the tbl(7) syntax tree data structures everywhere.
Move them to their own include file, "tbl.h", and improve comments.

6 years agoHTML syntax audit: render \p as <br/>, not as <div>.
Ingo Schwarze [Tue, 4 Dec 2018 18:29:38 +0000 (18:29 +0000)]
HTML syntax audit: render \p as <br/>, not as <div>.
It can occur anywhere, in particular in phrasing context.

6 years agoRestrict "vertical-align: middle;" to <td> descendants of class="tbl"
Ingo Schwarze [Tue, 4 Dec 2018 06:11:49 +0000 (06:11 +0000)]
Restrict "vertical-align: middle;" to <td> descendants of class="tbl"
elements, we don't want that for other tables.

6 years agoMake sure all borders in a table are drawn in the same color.
Ingo Schwarze [Tue, 4 Dec 2018 05:21:04 +0000 (05:21 +0000)]
Make sure all borders in a table are drawn in the same color.
Required because browsers tend to have inconsistent defaults:
For example, Firefox 62.0.2 sets border-color for tbody, but not for table,
and Pali Rohar reports that Chrome set it for td, but not for tr or tbody.
The td part is from Pali Rohar, the tbody and tr parts from me.

6 years agoDuring validation, drop .br before a text line starting with a
Ingo Schwarze [Tue, 4 Dec 2018 03:28:58 +0000 (03:28 +0000)]
During validation, drop .br before a text line starting with a
blank, rather than teaching each formatter individually to ignore
the .br in such situations.  That's simpler and also results in
better diagnostics.

Mark Harris <mark dot hsj at gmail dot com> reported
that -T html got confused in particular.

6 years agoClean up the validation of .Pp, .PP, .sp, and .br. Make sure all
Ingo Schwarze [Tue, 4 Dec 2018 02:53:51 +0000 (02:53 +0000)]
Clean up the validation of .Pp, .PP, .sp, and .br.  Make sure all
combinations are handled, and are handled in a systematic manner.
This resolves some erratic duplicate handling, handles a number of
missing cases, and improves diagnostics in various respects.

Move validation of .br and .sp to the roff validation module
rather than doing that twice in the mdoc and man validation modules.
Move the node relinking function to the roff library where it belongs.

In validation functions, only look at the node itself, at previous
nodes, and at descendants, not at following nodes or ancestors,
such that only nodes are inspected which are already validated.

6 years agoIn the validators, translate obsolete macro aliases (Lp, Ot, LP, P)
Ingo Schwarze [Mon, 3 Dec 2018 21:00:10 +0000 (21:00 +0000)]
In the validators, translate obsolete macro aliases (Lp, Ot, LP, P)
to the standard forms (Pp, Ft, PP) up front, such that later code
does not need to look for the obsolete versions.
This reduces the risk of incomplete handling.

6 years agoRender .br as <br/>, not as an empty <div>.
Ingo Schwarze [Mon, 3 Dec 2018 16:18:02 +0000 (16:18 +0000)]
Render .br as <br/>, not as an empty <div>.
The element <br/> was already employed for many other purposes,
so there is nothing wrong with using it.
Also, it is safer because <br/> is permitted in phrasing content,
whereas <div> is only allowed in flow content.

This is the first part of the HTML syntax audit which i wanted
to do for a long time.  Reminded by a loosely related bug report
from Mark Harris <mark dot hsj at gmail dot com>.

Examples of where this caused HTML nesting syntax errors:
* in man(7) code between .nf and .fi
* in mdoc(7) code between .Bd -unfilled and .Ed
* in mdoc(7) code between .Ql Xo and .Xc
* in mdoc(7) code between .Rs and .Re

6 years agoDo not draw horizontal lines through vertical spans
Ingo Schwarze [Thu, 29 Nov 2018 23:08:13 +0000 (23:08 +0000)]
Do not draw horizontal lines through vertical spans
which are requested in the data section rather than in the layout.
Mini-feature found in misc/pfm(1).

6 years agoNow that it is better understood how borders work,
Ingo Schwarze [Thu, 29 Nov 2018 21:40:53 +0000 (21:40 +0000)]
Now that it is better understood how borders work,
rewrite tbl_hrule() in a simpler way.
Fix several bugs in the process.

No more special flags, just use the existing TBL_OPT_* from mandoc.h.
Reduce the number of tracked rows from three to two, which is more logical:
one above the line and one below is sufficient to figure out crossings.
No more magic quirks, all conditions are readily comprehensible now.
Add comments.

6 years agoBetter handle automatic column width assignments in the presence of
Ingo Schwarze [Thu, 29 Nov 2018 01:55:02 +0000 (01:55 +0000)]
Better handle automatic column width assignments in the presence of
horizontal spans, by implementing a moderately difficult iterative
algoritm.  The benefit is that spans containing long text no longer
cause an excessive width of their starting column.

The result is likely not optimal, in particular in the presence
of many spans overlapping in complicated ways nor when spans
interact with equalizing or maximizing colums.  But i doubt the
practical usefulness of making this more complicated.

Issue originally reported in synaptics(4), which now looks better,
by tedu@ three years ago, and reminded by Pali Rohar this summer.

6 years agoBugfix: never set termp->enc to the ambiguous value TERMENC_LOCALE,
Ingo Schwarze [Wed, 28 Nov 2018 14:23:06 +0000 (14:23 +0000)]
Bugfix: never set termp->enc to the ambiguous value TERMENC_LOCALE,
but instead set it to TERMENC_UTF8 or TERMENC_ASCII.
Makes tbl(7) box drawing work under -T locale (that is, by default
when LC_CTYPE is defined appropriately).

6 years agoadditional check needed after the previous (box drawing) patch
Ingo Schwarze [Wed, 28 Nov 2018 13:43:54 +0000 (13:43 +0000)]
additional check needed after the previous (box drawing) patch

6 years agoIn -T utf8 output mode, render tbl(7) borders with the Unicode
Ingo Schwarze [Wed, 28 Nov 2018 04:47:51 +0000 (04:47 +0000)]
In -T utf8 output mode, render tbl(7) borders with the Unicode
box drawing characters, U+2500 to U+257F.

Originally suggested by bentley@ four years ago,
reminded this summer by Pali Rohar.

Binary and decimal arithmetics are boring,
so let's use some ternary arithmetics for a change.

That said, some other aspects are too complicated for my liking,
so this could use some polishing in the future.

6 years agoImplement tbl(7) lines in -T html output,
Ingo Schwarze [Mon, 26 Nov 2018 21:06:02 +0000 (21:06 +0000)]
Implement tbl(7) lines in -T html output,
as far as they are on the edges of table cells
rather than going through the middle of cells:

* the box, doublebox, and allbox options;
* the | and || layout modifiers;
* and the _ and = data lines;
- but not yet _ and = in individual layout and data cells.

Missing feature reported by Pali dot Rohar at gmail dot com.

6 years agoWhen a conditional block is closed by putting "\}" on a text line
Ingo Schwarze [Mon, 26 Nov 2018 17:44:34 +0000 (17:44 +0000)]
When a conditional block is closed by putting "\}" on a text line
by itself (which is somewhat unusual but not invalid; most authors
use the empty macro line ".\}" instead), agree more closely with
groff and do not produce a double space in the output.

Quirk reported by millert@.

While here, tweak the rest of the function body of roff_cond_text()
to more closely match roff_cond_sub().  The subtly different handling
could make people (including myself) wonder whether there is any
point in being different.  Testing shows there is not.

6 years agoMark Harris pointed out that people might have doubts whether all files
Ingo Schwarze [Mon, 26 Nov 2018 17:11:11 +0000 (17:11 +0000)]
Mark Harris pointed out that people might have doubts whether all files
contained in the mandoc toolkit are "code and documentation", and whether
this is of any consequence for licensing, so clarify.

6 years agoPlace mandoc.css into the public domain.
Ingo Schwarze [Mon, 26 Nov 2018 15:02:38 +0000 (15:02 +0000)]
Place mandoc.css into the public domain.

The reason for doing this rather than using the ISC license
is that i guess that in some contexts, a requirement to preserve
a Copyright and license header might be inconvenient, and i really
don't care at all how people use it.

What matters is that they do use it, or something similar - attempts
to use mandoc without any CSS are a constant source of grief and
bogus bug reports because HTML without CSS doesn't look very good:
the more structural and semantic and the less presentational and
old-fashioned the HTML, the more so.

Thanks to Mark Harris <mark dot hsj at gmail dot com> for pointing out
that the permissions on this particular file were unclear.

6 years agoSimplify writing of tbl(7) cells by using the new feature of passing
Ingo Schwarze [Mon, 26 Nov 2018 01:51:46 +0000 (01:51 +0000)]
Simplify writing of tbl(7) cells by using the new feature of passing
a NULL pointer for the value of a style attribute, in which case
the attribute is omitted from the HTML element.
Minus 12 lines of ugly and repetitive code, no functional change.

6 years agoSupport more than one style attribute one the same HTML element.
Ingo Schwarze [Mon, 26 Nov 2018 01:38:23 +0000 (01:38 +0000)]
Support more than one style attribute one the same HTML element.
In fact, this is already required when a table uses non-default
horizontal and vertical alignment in the same cell.

6 years agoLet cells containing nothing but \^ extend the cell above.
Ingo Schwarze [Sun, 25 Nov 2018 21:17:34 +0000 (21:17 +0000)]
Let cells containing nothing but \^ extend the cell above.
Missing feature reported by Pali dot Rohar at gmail dot com.

6 years agoIn tbl(7) -T html output,
Ingo Schwarze [Sun, 25 Nov 2018 19:24:20 +0000 (19:24 +0000)]
In tbl(7) -T html output,
span cells horizontally and vertically as requested by the layout.
Does not handle spans requested in the data section yet.

To be able to do this, record the number of rows spanned
in the first data cell (struct tbl_dat) of a vertical span.

Missing feature reported by Pali dot Rohar at gmail dot com.

6 years agoHTML formatting of .IP
Ingo Schwarze [Sun, 25 Nov 2018 18:04:58 +0000 (18:04 +0000)]
HTML formatting of .IP

6 years agoImplement horizontal and vertical alignment of tbl(7) cell content
Ingo Schwarze [Sat, 24 Nov 2018 23:03:18 +0000 (23:03 +0000)]
Implement horizontal and vertical alignment of tbl(7) cell content
in -T html output.  This does not handle spanned cells yet.
Missing feature reported by Pali dot Rohar at gmail dot com.

6 years agoWhen a font escape appears in the middle of a string,
Ingo Schwarze [Fri, 23 Nov 2018 19:17:05 +0000 (19:17 +0000)]
When a font escape appears in the middle of a string,
make sure it doesn't cause output of bogus whitespace.
Fixing a bug reported by Pali dot Rohar at gmail dot com.

6 years agoCorrect and shorten the description of the sort order of apropos(1)
Ingo Schwarze [Thu, 22 Nov 2018 12:33:52 +0000 (12:33 +0000)]
Correct and shorten the description of the sort order of apropos(1)
results.  As a matter of fact, which manpath the page comes from
does not matter in that context.  That only matters for the priority
of pages in man(1) mode (without -a, -f, and -k).

Noticed while working on a patch from Yuri Pankov <yuripv at FreeBSD>.

6 years agoIn apropos(1) output, stop sorting .Nm search results by name
Ingo Schwarze [Thu, 22 Nov 2018 12:01:46 +0000 (12:01 +0000)]
In apropos(1) output, stop sorting .Nm search results by name
priorities (bits).  The obscure feature wasn't documented and merely
confused people - for example Edward Tomasz Napierala <trasz at
FreeBSD>, see https://bugs.freebsd.org/bugzilla/show_bug.cgi?id=227408.

Smaller patch provided by Yuri Pankov <yuripv at FreeBSD>, but i'm
also retiring the now unused "bits" member from struct manpage.
Simplification is good.

6 years agoIn -T locale (the default), -T ascii, and -T utf8 mode, provide a new
Ingo Schwarze [Thu, 22 Nov 2018 11:30:23 +0000 (11:30 +0000)]
In -T locale (the default), -T ascii, and -T utf8 mode, provide a new
output option -O tag[=term] to move right to the definition of "term" when
opening the manual page in a pager, effectively porting the -T html
fragment name feature - https://man.openbsd.org/ksh#ulimit - to the
terminal.  Try:

$ man -O tag uvm_sysctl
$ man -O tag=ulimit ksh
$ man -O tag 3 compress

Feature development triggered by a question from kn@.  Klemens also
tested, provided feedback that resulted in improvements, and provided
an OK.

6 years agoImprove POSIX compliance by making case-insensitive extended
Ingo Schwarze [Mon, 19 Nov 2018 19:27:37 +0000 (19:27 +0000)]
Improve POSIX compliance by making case-insensitive extended
regular expressions the default in man(1) -k searches, also matching
what the man-db package used by many Linux distributions does.

Originally requested by Wolfram Schneider <wosch at FreeBSD>
via Yuri Pankov <yuripv at FreeBSD>.

Feedback and OK cheloha@, and no objections when shown on tech@.

Thanks to cheloha@ for pointing out that POSIX requires this behaviour
and for the suggestion to explicitly say that *extended* regular
expressions are used here.

While here, unify spelling of case-[in]sensitive, fix a typo,
update the EXAMPLES, and add a STANDARDS section.

6 years agoCorrectly construct empty lists in dbm_page_get().
Ingo Schwarze [Mon, 19 Nov 2018 19:22:07 +0000 (19:22 +0000)]
Correctly construct empty lists in dbm_page_get().

Original commit message by the author of this bugfix patch, bluhm@:

lstmatch() expects a list of strings separated by \0 and terminated
with \0\0.  In the NULL case dbm_page_get() returned only simple
strings so correct processing was depending on data layout.  Use
an additional \0 to terminate the single string lists.  Found by
mandoc regress since llvm linker on amd64 arranges strings differently.

6 years agoin -man -Thtml, vertical spacing is required before .IP
Ingo Schwarze [Thu, 25 Oct 2018 21:23:52 +0000 (21:23 +0000)]
in -man -Thtml, vertical spacing is required before .IP

6 years agoImplement the \f(CW and \f(CR (constant width font) escape sequences
Ingo Schwarze [Thu, 25 Oct 2018 01:32:40 +0000 (01:32 +0000)]
Implement the \f(CW and \f(CR (constant width font) escape sequences
for HTML output.  Somewhat relevant because pod2man(1) relies on this.
Missing feature reported by Pali dot Rohar at gmail dot com.

Note that constant width font was already correctly selected before
this when required by semantic markup.  Only attempting physical
markup with the low-level escape sequence was ineffective.

6 years agoThe ctags(1) file format uses whitespace as a field delimiter, and
Ingo Schwarze [Tue, 23 Oct 2018 20:42:37 +0000 (20:42 +0000)]
The ctags(1) file format uses whitespace as a field delimiter, and
there is no escaping mechanism, so tags cannot contain whitespace.
Consequently, we used to simply not tag macro arguments containing
space characters.  Instead, let's tag the first word, unless there
is a proper match for that word somewhere else.  For example, this
makes ":tquery" work in ntpd.conf(5).

Feature suggested by kn@, who also thinks the implementation looks
reasonable and works in his testing.

6 years agoInput lines that are not blank but generate no output,
Ingo Schwarze [Tue, 23 Oct 2018 17:18:01 +0000 (17:18 +0000)]
Input lines that are not blank but generate no output,
for example lines containing nothing but "\&", are significant
in no-fill mode and can be represented by blank lines inside <pre>.
Fixing a bug that Pali dot Rohar at gmail dot com found
in pod2man(1) output, for example Email::Address::XS(3p).

While here, inside no-fill mode, there is no need to encode
totally blank input lines by emulating .PP - just let them
through as we are inside <pre> anyway.

6 years agoRewrite parse_path_info() to be four lines shorter, simplify ownership
Ingo Schwarze [Fri, 19 Oct 2018 21:10:56 +0000 (21:10 +0000)]
Rewrite parse_path_info() to be four lines shorter, simplify ownership
of allocated strings, do not write to the input string, and improve
diagnostic output.

The confusing error message "invalid arch" as a reaction to mistyping
the release name was noticed by tb@, who likes the new code and message.

6 years agoupdate DESCRIPTION and COMPATIBILITY, mostly correcting statements
Ingo Schwarze [Thu, 4 Oct 2018 15:32:09 +0000 (15:32 +0000)]
update DESCRIPTION and COMPATIBILITY, mostly correcting statements
from the past that are no longer true

6 years agoStop abusing subsections to represent the list of escape sequences;
Ingo Schwarze [Thu, 4 Oct 2018 15:16:23 +0000 (15:16 +0000)]
Stop abusing subsections to represent the list of escape sequences;
instead, use .Bl -tag like everywhere else.  The same was already
done for requests quite some time ago.  Also, consistently mark up
escape sequences with .Ic, just like requests.

6 years agoWhen a subsection header contains no letters but only special
Ingo Schwarze [Thu, 4 Oct 2018 13:23:04 +0000 (13:23 +0000)]
When a subsection header contains no letters but only special
characters, skip the TOC entry.  Issue reported by kristaps@.

6 years agoadd DESCRIPTION and .Ss to the toc; suggested by espie@
Ingo Schwarze [Tue, 2 Oct 2018 19:44:15 +0000 (19:44 +0000)]
add DESCRIPTION and .Ss to the toc; suggested by espie@

6 years agoenable the equivalent of -O toc in man.cgi(8)
Ingo Schwarze [Tue, 2 Oct 2018 19:41:23 +0000 (19:41 +0000)]
enable the equivalent of -O toc in man.cgi(8)

6 years agoAdd an option -T html -O toc to add a brief table of contents near
Ingo Schwarze [Tue, 2 Oct 2018 14:56:47 +0000 (14:56 +0000)]
Add an option -T html -O toc to add a brief table of contents near
the top of HTML pages containing at least two non-standard sections.
Suggested by Adam Kalisz and discussed with kristaps@ during EuroBSDCon 2018.

6 years agoSupport a second argument to -O man,
Ingo Schwarze [Tue, 2 Oct 2018 12:33:36 +0000 (12:33 +0000)]
Support a second argument to -O man,
selecting the format according to local existence of the file.
Suggested by kristaps@ during EuroBSDCon 2018.
Written on the train Frankfurt-Karlsruhe returning from EuroBSDCon.

6 years agoRender the eqn(7) "sqrt" function as U+221A in UTF-8 output.
Ingo Schwarze [Tue, 2 Oct 2018 12:18:33 +0000 (12:18 +0000)]
Render the eqn(7) "sqrt" function as U+221A in UTF-8 output.
This also agrees with what groff does.
Suggested by an attendee of EuroBSDCon 2018 in Bucuresti.
Written on the plane Bucuresti-Frankfurt returning from EuroBSDCon.

6 years agoAdd missing URI encoding when writing HTTP redirects,
Ingo Schwarze [Mon, 1 Oct 2018 08:06:53 +0000 (08:06 +0000)]
Add missing URI encoding when writing HTTP redirects,
fixing a bug reported by <jungleboogie0 at gmail dot com> on bugs@.
While here, fully validate the arch name
such that we do not have to URI encode that one.

6 years agofeature suggestions from EuroBSDCon 2018
Ingo Schwarze [Sun, 23 Sep 2018 05:34:58 +0000 (05:34 +0000)]
feature suggestions from EuroBSDCon 2018

6 years agoReduce excessive right padding in tagged list heads.
Ingo Schwarze [Mon, 27 Aug 2018 23:13:44 +0000 (23:13 +0000)]
Reduce excessive right padding in tagged list heads.
The 1.2em was an approximate equivalent of the 2n traditionally used
for terminal display, but it is much too wide for HTML rendering.
Issue reported by mikeb@.

6 years agoSupport nesting of elements with next-line scope.
Ingo Schwarze [Sun, 26 Aug 2018 16:21:23 +0000 (16:21 +0000)]
Support nesting of elements with next-line scope.
For example, ksh93(1) needs this for .B\n.SM.

6 years agoRudimentary implementation of the roff(7) .char (output glyph
Ingo Schwarze [Sat, 25 Aug 2018 16:53:38 +0000 (16:53 +0000)]
Rudimentary implementation of the roff(7) .char (output glyph
definition) request, used for example by groff_hdtbl(7).

This simplistic implementation may interact incorrectly
with the .tr (input character translation) request.
But come on, you are not only using .char *and* .tr, but you do so
with respect to the same character in the same manual page?

6 years agoIf man(7) next-line scope is open and the line ends with \c,
Ingo Schwarze [Sat, 25 Aug 2018 12:33:03 +0000 (12:33 +0000)]
If man(7) next-line scope is open and the line ends with \c,
the scope remains open.  Needed for example for groff_man(7).

6 years agoRudimentary implementation of the roff(7) .while request.
Ingo Schwarze [Fri, 24 Aug 2018 23:12:33 +0000 (23:12 +0000)]
Rudimentary implementation of the roff(7) .while request.
Needed for example by groff_hdtbl(7).

There are two limitations:
It does not support nested .while requests yet,
and each .while loop must start and end in the same scope.

The roff_parseln() return codes are now more flexible
and allow OR'ing options.

6 years agoThe upcoming .while request will have to re-execute roff(7) lines
Ingo Schwarze [Thu, 23 Aug 2018 19:33:27 +0000 (19:33 +0000)]
The upcoming .while request will have to re-execute roff(7) lines
parsed earlier, so they will have to be saved for reuse - but the
read.c preparser does not know yet whether a line contains a .while
request before passing it to the roff parser.  To cope with that,
save all parsed lines for now.  Even shortens the code by 20 lines.

6 years agoImplement the roff(7) .shift and .return requests,
Ingo Schwarze [Thu, 23 Aug 2018 14:29:38 +0000 (14:29 +0000)]
Implement the roff(7) .shift and .return requests,
for example used by groff_hdtbl(7) and groff_mom(7).

Also correctly interpolate arguments during nested macro execution
even after .shift and .return, implemented using a stack of argument
arrays.

Note that only read.c, but not roff.c can detect the end of a macro
execution, and the existence of .shift implies that arguments cannot
be interpolated up front, so unfortunately, this includes a partial
revert of roff.c rev. 1.337, moving argument interpolation back into
the function roff_res().

6 years agoImplement the \\$@ escape sequence (insert all macro arguments,
Ingo Schwarze [Tue, 21 Aug 2018 18:15:22 +0000 (18:15 +0000)]
Implement the \\$@ escape sequence (insert all macro arguments,
quoted) in addition to the already supported \\$* (similar, but
unquoted).  Then use \\$@ to improve the implementation of
the .als request (macro alias).

Needed by groff_hdtbl(7).
Gosh, it feels like the manual pages of the groff package are
exercising every bloody roff(7) feature under the sun.  In the
manual page source code itself, not merely in the implementation
of the used macro packages, that is.

6 years agoImprove the ASCII rendering of \(Po (Pound Sterling)
Ingo Schwarze [Tue, 21 Aug 2018 16:06:48 +0000 (16:06 +0000)]
Improve the ASCII rendering of \(Po (Pound Sterling)
and of the playing card suits to match groff, using feedback
from Ralph Corderoy <ralph at inputplus dot co dot uk>.

6 years agoFix some issues found looking at groff_char(7):
Ingo Schwarze [Tue, 21 Aug 2018 01:59:22 +0000 (01:59 +0000)]
Fix some issues found looking at groff_char(7):
* Add two missing characters, \('Y and \('y.
* The Weierstrass p is not capital, see http://unicode.org/notes/tn27/.
* Add a groff-compatible ASCII transliteration for U+02DC: "~".

6 years ago\f[] means \fP, not \fR
Ingo Schwarze [Mon, 20 Aug 2018 18:06:56 +0000 (18:06 +0000)]
\f[] means \fP, not \fR

6 years agoExpand \n(.$ (the number of macro arguments) right in roff_userdef(),
Ingo Schwarze [Mon, 20 Aug 2018 17:25:09 +0000 (17:25 +0000)]
Expand \n(.$ (the number of macro arguments) right in roff_userdef(),
before even reparsing the expanded macro.
That is the least dirty way to fix the bug that \(.$ remained set
after execution of the user-defined macro ended.  Any other way
to fix it would probably require changes to read.c, which really
shouldn't be bothered with such roff(7) internals.

6 years agoDisable one test for now that is broken after the addition of \).
Ingo Schwarze [Sun, 19 Aug 2018 23:58:09 +0000 (23:58 +0000)]
Disable one test for now that is broken after the addition of \).
It is not broken because of \), which is correctly implemented, but
the addition merely reveals a hidden bug elsewhere, almost certainly
in \\ handling.  Given that \\ is among the most mysterious escape
sequences and using it is very strongly discouraged in manual pages,
fixing that is not urgent - and may be hard.

6 years agoAdd the \) special character, a variant of \& so arcane that i
Ingo Schwarze [Sun, 19 Aug 2018 23:48:36 +0000 (23:48 +0000)]
Add the \) special character, a variant of \& so arcane that i
intentionally leave it undocumented.  Abused for example in the
groff(7) manual page.

6 years agoDo alignment of non-numeric strings in numeric cells the same way
Ingo Schwarze [Sun, 19 Aug 2018 23:10:28 +0000 (23:10 +0000)]
Do alignment of non-numeric strings in numeric cells the same way
as groff, and also honour the explicit alignment indicator "\&".
This required an almost complete rewrite of both the measurement
function and the formatter function for numeric cells.

6 years agodo not print horizontal lines inside vertical spans
Ingo Schwarze [Sun, 19 Aug 2018 19:32:21 +0000 (19:32 +0000)]
do not print horizontal lines inside vertical spans

6 years agoMostly complete implementation of the 'c' (character available)
Ingo Schwarze [Sun, 19 Aug 2018 17:46:14 +0000 (17:46 +0000)]
Mostly complete implementation of the 'c' (character available)
roff conditional, except that the .char request still isn't supported
and that behaviour differs from groff in many edge cases.
But at least valid character names and numbers are now distinguished
from invalid ones.
This also fixes the bug that parsing of the 'c' conditional was
incomplete, which resulted in leaking the tested character to the
input parser at the beginning of the body when the condition was
inverted.

6 years agoBugfix: When a line ends with '\ \"', don't strip the trailing space
Ingo Schwarze [Sat, 18 Aug 2018 22:05:43 +0000 (22:05 +0000)]
Bugfix: When a line ends with '\ \"', don't strip the trailing space
because that turned it into a bogus line continuation.

6 years agosupport the highly surprising escape sequence \# (line continuation
Ingo Schwarze [Sat, 18 Aug 2018 21:37:01 +0000 (21:37 +0000)]
support the highly surprising escape sequence \# (line continuation
with comment); used for example by gropdf(1)

6 years agoparagraphs can contain .MT and .UR blocks
Ingo Schwarze [Sat, 18 Aug 2018 20:41:54 +0000 (20:41 +0000)]
paragraphs can contain .MT and .UR blocks

6 years agoIf a tbl(7) column contains both text cells and numeric cells,
Ingo Schwarze [Sat, 18 Aug 2018 20:18:14 +0000 (20:18 +0000)]
If a tbl(7) column contains both text cells and numeric cells,
horizontally align the numbers in the same way as groff does.

6 years ago.RE causes a line break even if .RS is not open
Ingo Schwarze [Sat, 18 Aug 2018 17:32:37 +0000 (17:32 +0000)]
.RE causes a line break even if .RS is not open

6 years ago.SY causes a one-column indentation even without any argument
Ingo Schwarze [Sat, 18 Aug 2018 17:07:23 +0000 (17:07 +0000)]
.SY causes a one-column indentation even without any argument

6 years agoDo not allocate a column for decimal points if all numbers are integers.
Ingo Schwarze [Sat, 18 Aug 2018 16:44:55 +0000 (16:44 +0000)]
Do not allocate a column for decimal points if all numbers are integers.

6 years agoUnsurprisingly, zero-width non-breaking spaces have... width 0.
Ingo Schwarze [Sat, 18 Aug 2018 15:17:03 +0000 (15:17 +0000)]
Unsurprisingly, zero-width non-breaking spaces have...  width 0.

6 years agoend of sentence detection after .ME and .UE, useful for some GNU manuals
Ingo Schwarze [Sat, 18 Aug 2018 15:13:32 +0000 (15:13 +0000)]
end of sentence detection after .ME and .UE, useful for some GNU manuals

6 years agoThe .nf/.fi (fill mode) requests never have text children
Ingo Schwarze [Sat, 18 Aug 2018 14:26:12 +0000 (14:26 +0000)]
The .nf/.fi (fill mode) requests never have text children
and in particular do not reset font mode.

6 years agoTwo consecutive .SY blocks only get a blank line in between
Ingo Schwarze [Sat, 18 Aug 2018 14:02:56 +0000 (14:02 +0000)]
Two consecutive .SY blocks only get a blank line in between
if the first one is explicitly closed with .YS.

6 years agoprevent line breaks in the middle of .OP
Ingo Schwarze [Sat, 18 Aug 2018 13:05:10 +0000 (13:05 +0000)]
prevent line breaks in the middle of .OP

6 years agoMassively reduce the amount of text, cutting it down to what is needed
Ingo Schwarze [Sat, 18 Aug 2018 04:32:10 +0000 (04:32 +0000)]
Massively reduce the amount of text, cutting it down to what is needed
to understand existing man(7) code and deleting parts that would only
be useful for writing new documents, which we strongly discourage:

* Delete the MANUAL STRUCTURE section which merely duplicates mdoc(7).
* Delete internal cross references only useful for writing new code.
* Delete many instances of "included only for compatibility" as the
  whole language is only provided for compatibility.
* Fix a few minor errors and omissions.

6 years agoimplement the GNU man-ext .SY/.YS (synopsis block) macro in man(7),
Ingo Schwarze [Sat, 18 Aug 2018 02:08:27 +0000 (02:08 +0000)]
implement the GNU man-ext .SY/.YS (synopsis block) macro in man(7),
used in most manual pages of the groff package

6 years agoRemove more pointer arithmetic passing via regions outside the array
Ingo Schwarze [Fri, 17 Aug 2018 20:33:37 +0000 (20:33 +0000)]
Remove more pointer arithmetic passing via regions outside the array
that is undefined according to the C standard.  Robert Elz <kre at
munnari dot oz dot au> pointed out i wasn't quite done yet.