]> git.tdb.fi Git - ext/subsurface.git/blob - parse-xml.c
Abstract out dive/sample allocation a bit
[ext/subsurface.git] / parse-xml.c
1 #include <stdio.h>
2 #include <ctype.h>
3 #include <string.h>
4 #include <stdlib.h>
5 #include <errno.h>
6 #include <time.h>
7 #include <libxml/parser.h>
8 #include <libxml/tree.h>
9
10 #include "dive.h"
11
12 int verbose;
13
14 struct dive_table dive_table;
15
16 /*
17  * Add a dive into the dive_table array
18  */
19 void record_dive(struct dive *dive)
20 {
21         int nr = dive_table.nr, allocated = dive_table.allocated;
22         struct dive **dives = dive_table.dives;
23
24         if (nr >= allocated) {
25                 allocated = (nr + 32) * 3 / 2;
26                 dives = realloc(dives, allocated * sizeof(struct dive *));
27                 if (!dives)
28                         exit(1);
29                 dive_table.dives = dives;
30                 dive_table.allocated = allocated;
31         }
32         dives[nr] = fixup_dive(dive);
33         dive_table.nr = nr+1;
34 }
35
36 static void start_match(const char *type, const char *name, char *buffer)
37 {
38         if (verbose > 2)
39                 printf("Matching %s '%s' (%s)\n",
40                         type, name, buffer);
41 }
42
43 static void nonmatch(const char *type, const char *name, char *buffer)
44 {
45         if (verbose > 1)
46                 printf("Unable to match %s '%s' (%s)\n",
47                         type, name, buffer);
48         free(buffer);
49 }
50
51 typedef void (*matchfn_t)(char *buffer, void *);
52
53 static int match(const char *pattern, int plen,
54                  const char *name, int nlen,
55                  matchfn_t fn, char *buf, void *data)
56 {
57         if (plen > nlen)
58                 return 0;
59         if (memcmp(pattern, name + nlen - plen, plen))
60                 return 0;
61         fn(buf, data);
62         return 1;
63 }
64
65
66 struct units input_units;
67
68 /*
69  * We're going to default to SI units for input. Yes,
70  * technically the SI unit for pressure is Pascal, but
71  * we default to bar (10^5 pascal), which people
72  * actually use. Similarly, C instead of Kelvin.
73  */
74 const struct units SI_units = {
75         .length = METERS,
76         .volume = LITER,
77         .pressure = BAR,
78         .temperature = CELSIUS,
79         .weight = KG
80 };
81
82 const struct units IMPERIAL_units = {
83         .length = FEET,
84         .volume = CUFT,
85         .pressure = PSI,
86         .temperature = FAHRENHEIT,
87         .weight = LBS
88 };
89
90 /*
91  * Dive info as it is being built up..
92  */
93 static struct dive *dive;
94 static struct sample *sample;
95 static struct tm tm;
96 static int event_index, cylinder_index;
97
98 static enum import_source {
99         UNKNOWN,
100         LIBDIVECOMPUTER,
101         SUUNTO,
102         UEMIS,
103         DIVINGLOG,
104         UDDF,
105 } import_source;
106
107 static time_t utc_mktime(struct tm *tm)
108 {
109         static const int mdays[] = {
110             0, 31, 59, 90, 120, 151, 181, 212, 243, 273, 304, 334
111         };
112         int year = tm->tm_year;
113         int month = tm->tm_mon;
114         int day = tm->tm_mday;
115
116         /* First normalize relative to 1900 */
117         if (year < 70)
118                 year += 100;
119         else if (year > 1900)
120                 year -= 1900;
121
122         /* Normalized to Jan 1, 1970: unix time */
123         year -= 70;
124
125         if (year < 0 || year > 129) /* algo only works for 1970-2099 */
126                 return -1;
127         if (month < 0 || month > 11) /* array bounds */
128                 return -1;
129         if (month < 2 || (year + 2) % 4)
130                 day--;
131         if (tm->tm_hour < 0 || tm->tm_min < 0 || tm->tm_sec < 0)
132                 return -1;
133         return (year * 365 + (year + 1) / 4 + mdays[month] + day) * 24*60*60UL +
134                 tm->tm_hour * 60*60 + tm->tm_min * 60 + tm->tm_sec;
135 }
136
137 static void divedate(char *buffer, void *_when)
138 {
139         int d,m,y;
140         time_t *when = _when;
141         int success = 0;
142
143         success = tm.tm_sec | tm.tm_min | tm.tm_hour;
144         if (sscanf(buffer, "%d.%d.%d", &d, &m, &y) == 3) {
145                 tm.tm_year = y;
146                 tm.tm_mon = m-1;
147                 tm.tm_mday = d;
148         } else if (sscanf(buffer, "%d-%d-%d", &y, &m, &d) == 3) {
149                 tm.tm_year = y;
150                 tm.tm_mon = m-1;
151                 tm.tm_mday = d;
152         } else {
153                 fprintf(stderr, "Unable to parse date '%s'\n", buffer);
154                 success = 0;
155         }
156
157         if (success)
158                 *when = utc_mktime(&tm);
159
160         free(buffer);
161 }
162
163 static void divetime(char *buffer, void *_when)
164 {
165         int h,m,s = 0;
166         time_t *when = _when;
167
168         if (sscanf(buffer, "%d:%d:%d", &h, &m, &s) >= 2) {
169                 tm.tm_hour = h;
170                 tm.tm_min = m;
171                 tm.tm_sec = s;
172                 if (tm.tm_year)
173                         *when = utc_mktime(&tm);
174         }
175         free(buffer);
176 }
177
178 /* Libdivecomputer: "2011-03-20 10:22:38" */
179 static void divedatetime(char *buffer, void *_when)
180 {
181         int y,m,d;
182         int hr,min,sec;
183         time_t *when = _when;
184
185         if (sscanf(buffer, "%d-%d-%d %d:%d:%d",
186                 &y, &m, &d, &hr, &min, &sec) == 6) {
187                 tm.tm_year = y;
188                 tm.tm_mon = m-1;
189                 tm.tm_mday = d;
190                 tm.tm_hour = hr;
191                 tm.tm_min = min;
192                 tm.tm_sec = sec;
193                 *when = utc_mktime(&tm);
194         }
195         free(buffer);
196 }
197
198 union int_or_float {
199         double fp;
200 };
201
202 enum number_type {
203         NEITHER,
204         FLOAT
205 };
206
207 static enum number_type integer_or_float(char *buffer, union int_or_float *res)
208 {
209         char *end;
210         long val;
211         double fp;
212
213         /* Integer or floating point? */
214         val = strtol(buffer, &end, 10);
215         if (val < 0 || end == buffer)
216                 return NEITHER;
217
218         /* Looks like it might be floating point? */
219         if (*end == '.') {
220                 errno = 0;
221                 fp = strtod(buffer, &end);
222                 if (!errno) {
223                         res->fp = fp;
224                         return FLOAT;
225                 }
226         }
227
228         res->fp = val;
229         return FLOAT;
230 }
231
232 static void pressure(char *buffer, void *_press)
233 {
234         double mbar;
235         pressure_t *pressure = _press;
236         union int_or_float val;
237
238         switch (integer_or_float(buffer, &val)) {
239         case FLOAT:
240                 /* Just ignore zero values */
241                 if (!val.fp)
242                         break;
243                 switch (input_units.pressure) {
244                 case PASCAL:
245                         mbar = val.fp / 100;
246                         break;
247                 case BAR:
248                         /* Assume mbar, but if it's really small, it's bar */
249                         mbar = val.fp;
250                         if (mbar < 5000)
251                                 mbar = mbar * 1000;
252                         break;
253                 case PSI:
254                         mbar = val.fp * 68.95;
255                         break;
256                 }
257                 if (mbar > 5 && mbar < 500000) {
258                         pressure->mbar = mbar + 0.5;
259                         break;
260                 }
261         /* fallthrough */
262         default:
263                 printf("Strange pressure reading %s\n", buffer);
264         }
265         free(buffer);
266 }
267
268 static void depth(char *buffer, void *_depth)
269 {
270         depth_t *depth = _depth;
271         union int_or_float val;
272
273         switch (integer_or_float(buffer, &val)) {
274         case FLOAT:
275                 switch (input_units.length) {
276                 case METERS:
277                         depth->mm = val.fp * 1000 + 0.5;
278                         break;
279                 case FEET:
280                         depth->mm = val.fp * 304.8 + 0.5;
281                         break;
282                 }
283                 break;
284         default:
285                 printf("Strange depth reading %s\n", buffer);
286         }
287         free(buffer);
288 }
289
290 static void temperature(char *buffer, void *_temperature)
291 {
292         temperature_t *temperature = _temperature;
293         union int_or_float val;
294
295         switch (integer_or_float(buffer, &val)) {
296         case FLOAT:
297                 /* Ignore zero. It means "none" */
298                 if (!val.fp)
299                         break;
300                 /* Celsius */
301                 switch (input_units.temperature) {
302                 case KELVIN:
303                         temperature->mkelvin = val.fp * 1000;
304                         break;
305                 case CELSIUS:
306                         temperature->mkelvin = (val.fp + 273.15) * 1000 + 0.5;
307                         break;
308                 case FAHRENHEIT:
309                         temperature->mkelvin = (val.fp + 459.67) * 5000/9;
310                         break;
311                 }
312                 break;
313         default:
314                 printf("Strange temperature reading %s\n", buffer);
315         }
316         free(buffer);
317 }
318
319 static void sampletime(char *buffer, void *_time)
320 {
321         int i;
322         int min, sec;
323         duration_t *time = _time;
324
325         i = sscanf(buffer, "%d:%d", &min, &sec);
326         switch (i) {
327         case 1:
328                 sec = min;
329                 min = 0;
330         /* fallthrough */
331         case 2:
332                 time->seconds = sec + min*60;
333                 break;
334         default:
335                 printf("Strange sample time reading %s\n", buffer);
336         }
337         free(buffer);
338 }
339
340 static void duration(char *buffer, void *_time)
341 {
342         sampletime(buffer, _time);
343 }
344
345 static void percent(char *buffer, void *_fraction)
346 {
347         fraction_t *fraction = _fraction;
348         union int_or_float val;
349
350         switch (integer_or_float(buffer, &val)) {
351         case FLOAT:
352                 if (val.fp <= 100.0)
353                         fraction->permille = val.fp * 10 + 0.5;
354                 break;
355
356         default:
357                 printf("Strange percentage reading %s\n", buffer);
358                 break;
359         }
360         free(buffer);
361 }
362
363 static void gasmix(char *buffer, void *_fraction)
364 {
365         /* libdivecomputer does negative percentages. */
366         if (*buffer == '-')
367                 return;
368         if (cylinder_index < MAX_CYLINDERS)
369                 percent(buffer, _fraction);
370 }
371
372 static void gasmix_nitrogen(char *buffer, void *_gasmix)
373 {
374         /* Ignore n2 percentages. There's no value in them. */
375 }
376
377 static void cylindersize(char *buffer, void *_volume)
378 {
379         volume_t *volume = _volume;
380         union int_or_float val;
381
382         switch (integer_or_float(buffer, &val)) {
383         case FLOAT:
384                 volume->mliter = val.fp * 1000 + 0.5;
385                 break;
386
387         default:
388                 printf("Strange volume reading %s\n", buffer);
389                 break;
390         }
391         free(buffer);
392 }
393
394 static void utf8_string(char *buffer, void *_res)
395 {
396         *(char **)_res = buffer;
397 }
398
399 /*
400  * Uemis water_pressure. In centibar. And when converting to
401  * depth, I'm just going to always use saltwater, because I
402  * think "true depth" is just stupid. From a diving standpoint,
403  * "true depth" is pretty much completely pointless, unless
404  * you're doing some kind of underwater surveying work.
405  *
406  * So I give water depths in "pressure depth", always assuming
407  * salt water. So one atmosphere per 10m.
408  */
409 static void water_pressure(char *buffer, void *_depth)
410 {
411         depth_t *depth = _depth;
412         union int_or_float val;
413         double atm, cm;
414
415         switch (integer_or_float(buffer, &val)) {
416         case FLOAT:
417                 if (!val.fp)
418                         break;
419                 /* cbar to atm */
420                 atm = (val.fp / 100) / 1.01325;
421                 /*
422                  * atm to cm. Why not mm? The precision just isn't
423                  * there.
424                  */
425                 cm = 100 * (atm - 1) + 0.5;
426                 if (cm > 0) {
427                         depth->mm = 10 * (long)cm;
428                         break;
429                 }
430         default:
431                 fprintf(stderr, "Strange water pressure '%s'\n", buffer);
432         }
433         free(buffer);
434 }
435
436 #define MATCH(pattern, fn, dest) \
437         match(pattern, strlen(pattern), name, len, fn, buf, dest)
438
439 static void get_index(char *buffer, void *_i)
440 {
441         int *i = _i;
442         *i = atoi(buffer);
443         free(buffer);
444 }
445
446 static void centibar(char *buffer, void *_pressure)
447 {
448         pressure_t *pressure = _pressure;
449         union int_or_float val;
450
451         switch (integer_or_float(buffer, &val)) {
452         case FLOAT:
453                 pressure->mbar = val.fp * 10 + 0.5;
454                 break;
455         default:
456                 fprintf(stderr, "Strange centibar pressure '%s'\n", buffer);
457         }
458         free(buffer);
459 }
460
461 static void decicelsius(char *buffer, void *_temp)
462 {
463         temperature_t *temp = _temp;
464         union int_or_float val;
465
466         switch (integer_or_float(buffer, &val)) {
467         case FLOAT:
468                 temp->mkelvin = (val.fp/10 + 273.15) * 1000 + 0.5;
469                 break;
470         default:
471                 fprintf(stderr, "Strange julian date: %s", buffer);
472         }
473         free(buffer);
474 }
475
476 static int uemis_fill_sample(struct sample *sample, const char *name, int len, char *buf)
477 {
478         return  MATCH(".reading.dive_time", sampletime, &sample->time) ||
479                 MATCH(".reading.water_pressure", water_pressure, &sample->depth) ||
480                 MATCH(".reading.active_tank", get_index, &sample->cylinderindex) ||
481                 MATCH(".reading.tank_pressure", centibar, &sample->cylinderpressure) ||
482                 MATCH(".reading.dive_temperature", decicelsius, &sample->temperature) ||
483                 0;
484 }
485
486 /*
487  * Divinglog is crazy. The temperatures are in celsius. EXCEPT
488  * for the sample temperatures, that are in Fahrenheit.
489  * WTF?
490  *
491  * Oh, and I think Diving Log *internally* probably kept them
492  * in celsius, because I'm seeing entries like
493  *
494  *      <Temp>32.0</Temp>
495  *
496  * in there. Which is freezing, aka 0 degC. I bet the "0" is
497  * what Diving Log uses for "no temperature".
498  *
499  * So throw away crap like that.
500  */
501 static void fahrenheit(char *buffer, void *_temperature)
502 {
503         temperature_t *temperature = _temperature;
504         union int_or_float val;
505
506         switch (integer_or_float(buffer, &val)) {
507         case FLOAT:
508                 /* Floating point equality is evil, but works for small integers */
509                 if (val.fp == 32.0)
510                         break;
511                 temperature->mkelvin = (val.fp + 459.67) * 5000/9;
512                 break;
513         default:
514                 fprintf(stderr, "Crazy Diving Log temperature reading %s\n", buffer);
515         }
516         free(buffer);
517 }
518
519 /*
520  * Did I mention how bat-shit crazy divinglog is? The sample
521  * pressures are in PSI. But the tank working pressure is in
522  * bar. WTF^2?
523  *
524  * Crazy stuff like this is why diveclog has everything in
525  * these inconvenient typed structures, and you have to say
526  * "pressure->mbar" to get the actual value. Exactly so that
527  * you can never have unit confusion.
528  */
529 static void psi(char *buffer, void *_pressure)
530 {
531         pressure_t *pressure = _pressure;
532         union int_or_float val;
533
534         switch (integer_or_float(buffer, &val)) {
535         case FLOAT:
536                 pressure->mbar = val.fp * 68.95 + 0.5;
537                 break;
538         default:
539                 fprintf(stderr, "Crazy Diving Log PSI reading %s\n", buffer);
540         }
541         free(buffer);
542 }
543
544 static int divinglog_fill_sample(struct sample *sample, const char *name, int len, char *buf)
545 {
546         return  MATCH(".p.time", sampletime, &sample->time) ||
547                 MATCH(".p.depth", depth, &sample->depth) ||
548                 MATCH(".p.temp", fahrenheit, &sample->temperature) ||
549                 MATCH(".p.press1", psi, &sample->cylinderpressure) ||
550                 0;
551 }
552
553 static int uddf_fill_sample(struct sample *sample, const char *name, int len, char *buf)
554 {
555         return  MATCH(".divetime", sampletime, &sample->time) ||
556                 MATCH(".depth", depth, &sample->depth) ||
557                 MATCH(".temperature", temperature, &sample->temperature) ||
558                 0;
559 }
560
561 /* We're in samples - try to convert the random xml value to something useful */
562 static void try_to_fill_sample(struct sample *sample, const char *name, char *buf)
563 {
564         int len = strlen(name);
565
566         start_match("sample", name, buf);
567         if (MATCH(".sample.pressure", pressure, &sample->cylinderpressure))
568                 return;
569         if (MATCH(".sample.cylpress", pressure, &sample->cylinderpressure))
570                 return;
571         if (MATCH(".sample.depth", depth, &sample->depth))
572                 return;
573         if (MATCH(".sample.temp", temperature, &sample->temperature))
574                 return;
575         if (MATCH(".sample.temperature", temperature, &sample->temperature))
576                 return;
577         if (MATCH(".sample.sampletime", sampletime, &sample->time))
578                 return;
579         if (MATCH(".sample.time", sampletime, &sample->time))
580                 return;
581
582         switch (import_source) {
583         case UEMIS:
584                 if (uemis_fill_sample(sample, name, len, buf))
585                         return;
586                 break;
587
588         case DIVINGLOG:
589                 if (divinglog_fill_sample(sample, name, len, buf))
590                         return;
591                 break;
592
593         case UDDF:
594                 if (uddf_fill_sample(sample, name, len, buf))
595                         return;
596                 break;
597
598         default:
599                 break;
600         }
601
602         nonmatch("sample", name, buf);
603 }
604
605 /*
606  * Crazy suunto xml. Look at how those o2/he things match up.
607  */
608 static int suunto_dive_match(struct dive *dive, const char *name, int len, char *buf)
609 {
610         return  MATCH(".o2pct", percent, &dive->cylinder[0].gasmix.o2) ||
611                 MATCH(".hepct_0", percent, &dive->cylinder[0].gasmix.he) ||
612                 MATCH(".o2pct_2", percent, &dive->cylinder[1].gasmix.o2) ||
613                 MATCH(".hepct_1", percent, &dive->cylinder[1].gasmix.he) ||
614                 MATCH(".o2pct_3", percent, &dive->cylinder[2].gasmix.o2) ||
615                 MATCH(".hepct_2", percent, &dive->cylinder[2].gasmix.he) ||
616                 MATCH(".o2pct_4", percent, &dive->cylinder[3].gasmix.o2) ||
617                 MATCH(".hepct_3", percent, &dive->cylinder[3].gasmix.he) ||
618                 MATCH(".cylindersize", cylindersize, &dive->cylinder[0].type.size) ||
619                 MATCH(".cylinderworkpressure", pressure, &dive->cylinder[0].type.workingpressure) ||
620                 0;
621 }
622
623 static const char *country, *city;
624
625 static void divinglog_place(char *place, void *_location)
626 {
627         char **location = _location;
628         char buffer[256], *p;
629         int len;
630
631         len = snprintf(buffer, sizeof(buffer),
632                 "%s%s%s%s%s",
633                 place,
634                 city ? ", " : "",
635                 city ? city : "",
636                 country ? ", " : "",
637                 country ? country : "");
638
639         p = malloc(len+1);
640         memcpy(p, buffer, len+1);
641         *location = p;
642
643         city = NULL;
644         country = NULL;
645 }
646
647 static int divinglog_dive_match(struct dive *dive, const char *name, int len, char *buf)
648 {
649         return  MATCH(".divedate", divedate, &dive->when) ||
650                 MATCH(".entrytime", divetime, &dive->when) ||
651                 MATCH(".depth", depth, &dive->maxdepth) ||
652                 MATCH(".tanksize", cylindersize, &dive->cylinder[0].type.size) ||
653                 MATCH(".presw", pressure, &dive->cylinder[0].type.workingpressure) ||
654                 MATCH(".comments", utf8_string, &dive->notes) ||
655                 MATCH(".country.name", utf8_string, &country) ||
656                 MATCH(".city.name", utf8_string, &city) ||
657                 MATCH(".place.name", divinglog_place, &dive->location) ||
658                 0;
659 }
660
661 static int buffer_value(char *buffer)
662 {
663         int val = atoi(buffer);
664         free(buffer);
665         return val;
666 }
667
668 static void uemis_length_unit(char *buffer, void *_unused)
669 {
670         input_units.length = buffer_value(buffer) ? FEET : METERS;
671 }
672
673 static void uemis_volume_unit(char *buffer, void *_unused)
674 {
675         input_units.volume = buffer_value(buffer) ? CUFT : LITER;
676 }
677
678 static void uemis_pressure_unit(char *buffer, void *_unused)
679 {
680 #if 0
681         input_units.pressure = buffer_value(buffer) ? PSI : BAR;
682 #endif
683 }
684
685 static void uemis_temperature_unit(char *buffer, void *_unused)
686 {
687         input_units.temperature = buffer_value(buffer) ? FAHRENHEIT : CELSIUS;
688 }
689
690 static void uemis_weight_unit(char *buffer, void *_unused)
691 {
692         input_units.weight = buffer_value(buffer) ? LBS : KG;
693 }
694
695 static void uemis_time_unit(char *buffer, void *_unused)
696 {
697 }
698
699 static void uemis_date_unit(char *buffer, void *_unused)
700 {
701 }
702
703 /* Modified julian day, yay! */
704 static void uemis_date_time(char *buffer, void *_when)
705 {
706         time_t *when = _when;
707         union int_or_float val;
708
709         switch (integer_or_float(buffer, &val)) {
710         case FLOAT:
711                 *when = (val.fp - 40587) * 86400;
712                 break;
713         default:
714                 fprintf(stderr, "Strange julian date: %s", buffer);
715         }
716         free(buffer);
717 }
718
719 /*
720  * Uemis doesn't know time zones. You need to do them as
721  * minutes, not hours.
722  *
723  * But that's ok, we don't track timezones yet either. We
724  * just turn everything into "localtime expressed as UTC".
725  */
726 static void uemis_time_zone(char *buffer, void *_when)
727 {
728 #if 0 /* seems like this is only used to display it correctly
729        * the stored time appears to be UTC */
730
731         time_t *when = _when;
732         signed char tz = atoi(buffer);
733
734         *when += tz * 3600;
735 #endif
736 }
737
738 /* 0 - air ; 1 - nitrox1 ; 2 - nitrox2 ; 3 = nitrox3 */
739 static int uemis_gas_template;
740
741 /*
742  * Christ. Uemis tank data is a total mess.
743  *
744  * We're passed a "virtual cylinder" (0 - 6) for the different
745  * Uemis tank cases ("air", "nitrox_1", "nitrox_2.{bottom,deco}"
746  * and "nitrox_3.{bottom,deco,travel}". We need to turn that
747  * into the actual cylinder data depending on the gas template,
748  * and ignore the ones that are irrelevant for that template.
749  *
750  * So for "template 2" (nitrox_2), we ignore virtual tanks 0-1
751  * (which are "air" and "nitrox_1" respectively), and tanks 4-6
752  * (which are the three "nitrox_3" tanks), and we turn virtual
753  * tanks 2/3 into actual tanks 0/1.
754  *
755  * Confused yet?
756  */
757 static int uemis_cylinder_index(void *_cylinder)
758 {
759         cylinder_t *cylinder = _cylinder;
760         unsigned int index = cylinder - dive->cylinder;
761
762         if (index > 6) {
763                 fprintf(stderr, "Uemis cylinder pointer calculations broken\n");
764                 return -1;
765         }
766         switch(uemis_gas_template) {
767         case 1: /* Dive uses tank 1 */
768                 index -= 1;
769         /* Fallthrough */
770         case 0: /* Dive uses tank 0 */
771                 if (index)
772                         index = -1;
773                 break;
774         case 2: /* Dive uses tanks 2-3 */
775                 index -= 2;
776                 if (index > 1)
777                         index = -1;
778                 break;
779         case 3: /* Dive uses tanks 4-6 */
780                 index -= 4;
781                 if (index > 2)
782                         index = -1;
783                 break;
784         }
785         return index;
786 }
787
788 static void uemis_cylindersize(char *buffer, void *_cylinder)
789 {
790         int index = uemis_cylinder_index(_cylinder);
791         if (index >= 0)
792                 cylindersize(buffer, &dive->cylinder[index].type.size);
793 }
794
795 static void uemis_percent(char *buffer, void *_cylinder)
796 {
797         int index = uemis_cylinder_index(_cylinder);
798         if (index >= 0)
799                 percent(buffer, &dive->cylinder[index].gasmix.o2);
800 }
801
802 static int uemis_dive_match(struct dive *dive, const char *name, int len, char *buf)
803 {
804         return  MATCH(".units.length", uemis_length_unit, &input_units) ||
805                 MATCH(".units.volume", uemis_volume_unit, &input_units) ||
806                 MATCH(".units.pressure", uemis_pressure_unit, &input_units) ||
807                 MATCH(".units.temperature", uemis_temperature_unit, &input_units) ||
808                 MATCH(".units.weight", uemis_weight_unit, &input_units) ||
809                 MATCH(".units.time", uemis_time_unit, &input_units) ||
810                 MATCH(".units.date", uemis_date_unit, &input_units) ||
811                 MATCH(".date_time", uemis_date_time, &dive->when) ||
812                 MATCH(".time_zone", uemis_time_zone, &dive->when) ||
813                 MATCH(".ambient.temperature", decicelsius, &dive->airtemp) ||
814                 MATCH(".gas.template", get_index, &uemis_gas_template) ||
815                 MATCH(".air.bottom_tank.size", uemis_cylindersize, dive->cylinder + 0) ||
816                 MATCH(".air.bottom_tank.oxygen", uemis_percent, dive->cylinder + 0) ||
817                 MATCH(".nitrox_1.bottom_tank.size", uemis_cylindersize, dive->cylinder + 1) ||
818                 MATCH(".nitrox_1.bottom_tank.oxygen", uemis_percent, dive->cylinder + 1) ||
819                 MATCH(".nitrox_2.bottom_tank.size", uemis_cylindersize, dive->cylinder + 2) ||
820                 MATCH(".nitrox_2.bottom_tank.oxygen", uemis_percent, dive->cylinder + 2) ||
821                 MATCH(".nitrox_2.deco_tank.size", uemis_cylindersize, dive->cylinder + 3) ||
822                 MATCH(".nitrox_2.deco_tank.oxygen", uemis_percent, dive->cylinder + 3) ||
823                 MATCH(".nitrox_3.bottom_tank.size", uemis_cylindersize, dive->cylinder + 4) ||
824                 MATCH(".nitrox_3.bottom_tank.oxygen", uemis_percent, dive->cylinder + 4) ||
825                 MATCH(".nitrox_3.deco_tank.size", uemis_cylindersize, dive->cylinder + 5) ||
826                 MATCH(".nitrox_3.deco_tank.oxygen", uemis_percent, dive->cylinder + 5) ||
827                 MATCH(".nitrox_3.travel_tank.size", uemis_cylindersize, dive->cylinder + 6) ||
828                 MATCH(".nitrox_3.travel_tank.oxygen", uemis_percent, dive->cylinder + 6) ||
829                 0;
830 }
831
832 /*
833  * Uddf specifies ISO 8601 time format.
834  *
835  * There are many variations on that. This handles the useful cases.
836  */
837 static void uddf_datetime(char *buffer, void *_when)
838 {
839         char c;
840         int y,m,d,hh,mm,ss;
841         time_t *when = _when;
842         struct tm tm = { 0 };
843         int i;
844
845         i = sscanf(buffer, "%d-%d-%d%c%d:%d:%d", &y, &m, &d, &c, &hh, &mm, &ss);
846         if (i == 7)
847                 goto success;
848         ss = 0;
849         if (i == 6)
850                 goto success;
851
852         i = sscanf(buffer, "%04d%02d%02d%c%02d%02d%02d", &y, &m, &d, &c, &hh, &mm, &ss);
853         if (i == 7)
854                 goto success;
855         ss = 0;
856         if (i == 6)
857                 goto success;
858 bad_date:
859         printf("Bad date time %s\n", buffer);
860         free(buffer);
861         return;
862
863 success:
864         if (c != 'T' && c != ' ')
865                 goto bad_date;
866         tm.tm_year = y;
867         tm.tm_mon = m - 1;
868         tm.tm_mday = d;
869         tm.tm_hour = hh;
870         tm.tm_min = mm;
871         tm.tm_sec = ss;
872         *when = utc_mktime(&tm);
873         free(buffer);
874 }
875
876 static int uddf_dive_match(struct dive *dive, const char *name, int len, char *buf)
877 {
878         return  MATCH(".datetime", uddf_datetime, &dive->when) ||
879                 MATCH(".diveduration", duration, &dive->duration) ||
880                 MATCH(".greatestdepth", depth, &dive->maxdepth) ||
881                 0;
882 }
883
884 /* We're in the top-level dive xml. Try to convert whatever value to a dive value */
885 static void try_to_fill_dive(struct dive *dive, const char *name, char *buf)
886 {
887         int len = strlen(name);
888
889         start_match("dive", name, buf);
890
891         switch (import_source) {
892         case SUUNTO:
893                 if (suunto_dive_match(dive, name, len, buf))
894                         return;
895                 break;
896
897         case UEMIS:
898                 if (uemis_dive_match(dive, name, len, buf))
899                         return;
900                 break;
901
902         case DIVINGLOG:
903                 if (divinglog_dive_match(dive, name, len, buf))
904                         return;
905                 break;
906
907         case UDDF:
908                 if (uddf_dive_match(dive, name, len, buf))
909                         return;
910                 break;
911
912         default:
913                 break;
914         }
915
916         if (MATCH(".number", get_index, &dive->number))
917                 return;
918         if (MATCH(".date", divedate, &dive->when))
919                 return;
920         if (MATCH(".time", divetime, &dive->when))
921                 return;
922         if (MATCH(".datetime", divedatetime, &dive->when))
923                 return;
924         if (MATCH(".maxdepth", depth, &dive->maxdepth))
925                 return;
926         if (MATCH(".meandepth", depth, &dive->meandepth))
927                 return;
928         if (MATCH(".depth.max", depth, &dive->maxdepth))
929                 return;
930         if (MATCH(".depth.mean", depth, &dive->meandepth))
931                 return;
932         if (MATCH(".duration", duration, &dive->duration))
933                 return;
934         if (MATCH(".divetime", duration, &dive->duration))
935                 return;
936         if (MATCH(".divetimesec", duration, &dive->duration))
937                 return;
938         if (MATCH(".surfacetime", duration, &dive->surfacetime))
939                 return;
940         if (MATCH(".airtemp", temperature, &dive->airtemp))
941                 return;
942         if (MATCH(".watertemp", temperature, &dive->watertemp))
943                 return;
944         if (MATCH(".temperature.air", temperature, &dive->airtemp))
945                 return;
946         if (MATCH(".temperature.water", temperature, &dive->watertemp))
947                 return;
948         if (MATCH(".cylinderstartpressure", pressure, &dive->cylinder[0].start))
949                 return;
950         if (MATCH(".cylinderendpressure", pressure, &dive->cylinder[0].end))
951                 return;
952         if (MATCH(".location", utf8_string, &dive->location))
953                 return;
954         if (MATCH(".notes", utf8_string, &dive->notes))
955                 return;
956
957         if (MATCH(".cylinder.size", cylindersize, &dive->cylinder[cylinder_index].type.size))
958                 return;
959         if (MATCH(".cylinder.workpressure", pressure, &dive->cylinder[cylinder_index].type.workingpressure))
960                 return;
961         if (MATCH(".cylinder.description", utf8_string, &dive->cylinder[cylinder_index].type.description))
962                 return;
963         if (MATCH(".cylinder.start", pressure, &dive->cylinder[cylinder_index].start))
964                 return;
965         if (MATCH(".cylinder.end", pressure, &dive->cylinder[cylinder_index].end))
966                 return;
967
968         if (MATCH(".o2", gasmix, &dive->cylinder[cylinder_index].gasmix.o2))
969                 return;
970         if (MATCH(".n2", gasmix_nitrogen, &dive->cylinder[cylinder_index].gasmix))
971                 return;
972         if (MATCH(".he", gasmix, &dive->cylinder[cylinder_index].gasmix.he))
973                 return;
974
975         nonmatch("dive", name, buf);
976 }
977
978 /*
979  * File boundaries are dive boundaries. But sometimes there are
980  * multiple dives per file, so there can be other events too that
981  * trigger a "new dive" marker and you may get some nesting due
982  * to that. Just ignore nesting levels.
983  */
984 static void dive_start(void)
985 {
986         if (dive)
987                 return;
988         dive = alloc_dive();
989         memset(&tm, 0, sizeof(tm));
990 }
991
992 static void sanitize_gasmix(struct gasmix *mix)
993 {
994         unsigned int o2, he;
995
996         o2 = mix->o2.permille;
997         he = mix->he.permille;
998
999         /* Regular air: leave empty */
1000         if (!he) {
1001                 if (!o2)
1002                         return;
1003                 /* 20.9% or 21% O2 is just air */
1004                 if (o2 >= 209 && o2 <= 210) {
1005                         mix->o2.permille = 0;
1006                         return;
1007                 }
1008         }
1009
1010         /* Sane mix? */
1011         if (o2 <= 1000 && he <= 1000 && o2+he <= 1000)
1012                 return;
1013         fprintf(stderr, "Odd gasmix: %d O2 %d He\n", o2, he);
1014         memset(mix, 0, sizeof(*mix));
1015 }
1016
1017 /*
1018  * See if the size/workingpressure looks like some standard cylinder
1019  * size, eg "AL80".
1020  */
1021 static void match_standard_cylinder(cylinder_type_t *type)
1022 {
1023         double cuft;
1024         int psi, len;
1025         const char *fmt;
1026         char buffer[20], *p;
1027
1028         /* Do we already have a cylinder description? */
1029         if (type->description)
1030                 return;
1031
1032         cuft = type->size.mliter / 28317.0;
1033         cuft *= type->workingpressure.mbar / 1013.25;
1034         psi = type->workingpressure.mbar / 68.95;
1035
1036         switch (psi) {
1037         case 2300 ... 2500:     /* 2400 psi: LP tank */
1038                 fmt = "LP%d";
1039                 break;
1040         case 2600 ... 2700:     /* 2640 psi: LP+10% */
1041                 fmt = "LP%d";
1042                 break;
1043         case 2900 ... 3100:     /* 3000 psi: ALx tank */
1044                 fmt = "AL%d";
1045                 break;
1046         case 3400 ... 3500:     /* 3442 psi: HP tank */
1047                 fmt = "HP%d";
1048                 break;
1049         case 3700 ... 3850:     /* HP+10% */
1050                 fmt = "HP%d+";
1051                 break;
1052         default:
1053                 return;
1054         }
1055         len = snprintf(buffer, sizeof(buffer), fmt, (int) (cuft+0.5));
1056         p = malloc(len+1);
1057         if (!p)
1058                 return;
1059         memcpy(p, buffer, len+1);
1060         type->description = p;
1061 }
1062
1063
1064 /*
1065  * There are two ways to give cylinder size information:
1066  *  - total amount of gas in cuft (depends on working pressure and physical size)
1067  *  - physical size
1068  *
1069  * where "physical size" is the one that actually matters and is sane.
1070  *
1071  * We internally use physical size only. But we save the workingpressure
1072  * so that we can do the conversion if required.
1073  */
1074 static void sanitize_cylinder_type(cylinder_type_t *type)
1075 {
1076         double volume_of_air, atm, volume;
1077
1078         /* If we have no working pressure, it had *better* be just a physical size! */
1079         if (!type->workingpressure.mbar)
1080                 return;
1081
1082         /* No size either? Nothing to go on */
1083         if (!type->size.mliter)
1084                 return;
1085
1086         if (input_units.volume == CUFT || import_source == SUUNTO) {
1087                 volume_of_air = type->size.mliter * 28.317;     /* milli-cu ft to milliliter */
1088                 atm = type->workingpressure.mbar / 1013.25;     /* working pressure in atm */
1089                 volume = volume_of_air / atm;                   /* milliliters at 1 atm: "true size" */
1090                 type->size.mliter = volume + 0.5;
1091         }
1092
1093         /* Ok, we have both size and pressure: try to match a description */
1094         match_standard_cylinder(type);
1095 }
1096
1097 static void sanitize_cylinder_info(struct dive *dive)
1098 {
1099         int i;
1100
1101         for (i = 0; i < MAX_CYLINDERS; i++) {
1102                 sanitize_gasmix(&dive->cylinder[i].gasmix);
1103                 sanitize_cylinder_type(&dive->cylinder[i].type);
1104         }
1105 }
1106
1107 static void dive_end(void)
1108 {
1109         if (!dive)
1110                 return;
1111         sanitize_cylinder_info(dive);
1112         record_dive(dive);
1113         dive = NULL;
1114         cylinder_index = 0;
1115 }
1116
1117 static void event_start(void)
1118 {
1119 }
1120
1121 static void event_end(void)
1122 {
1123         event_index++;
1124 }
1125
1126 static void cylinder_start(void)
1127 {
1128 }
1129
1130 static void cylinder_end(void)
1131 {
1132         cylinder_index++;
1133 }
1134
1135 static void sample_start(void)
1136 {
1137         sample = prepare_sample(&dive);
1138         event_index = 0;
1139 }
1140
1141 static void sample_end(void)
1142 {
1143         if (!dive)
1144                 return;
1145
1146         finish_sample(dive, sample);
1147         sample = NULL;
1148 }
1149
1150 static void entry(const char *name, int size, const char *raw)
1151 {
1152         char *buf = malloc(size+1);
1153
1154         if (!buf)
1155                 return;
1156         memcpy(buf, raw, size);
1157         buf[size] = 0;
1158         if (sample) {
1159                 try_to_fill_sample(sample, name, buf);
1160                 return;
1161         }
1162         if (dive) {
1163                 try_to_fill_dive(dive, name, buf);
1164                 return;
1165         }
1166 }
1167
1168 static const char *nodename(xmlNode *node, char *buf, int len)
1169 {
1170         if (!node || !node->name)
1171                 return "root";
1172
1173         buf += len;
1174         *--buf = 0;
1175         len--;
1176
1177         for(;;) {
1178                 const char *name = node->name;
1179                 int i = strlen(name);
1180                 while (--i >= 0) {
1181                         unsigned char c = name[i];
1182                         *--buf = tolower(c);
1183                         if (!--len)
1184                                 return buf;
1185                 }
1186                 node = node->parent;
1187                 if (!node || !node->name)
1188                         return buf;
1189                 *--buf = '.';
1190                 if (!--len)
1191                         return buf;
1192         }
1193 }
1194
1195 #define MAXNAME 64
1196
1197 static void visit_one_node(xmlNode *node)
1198 {
1199         int len;
1200         const unsigned char *content;
1201         char buffer[MAXNAME];
1202         const char *name;
1203
1204         content = node->content;
1205         if (!content)
1206                 return;
1207
1208         /* Trim whitespace at beginning */
1209         while (isspace(*content))
1210                 content++;
1211
1212         /* Trim whitespace at end */
1213         len = strlen(content);
1214         while (len && isspace(content[len-1]))
1215                 len--;
1216
1217         if (!len)
1218                 return;
1219
1220         /* Don't print out the node name if it is "text" */
1221         if (!strcmp(node->name, "text"))
1222                 node = node->parent;
1223
1224         name = nodename(node, buffer, sizeof(buffer));
1225
1226         entry(name, len, content);
1227 }
1228
1229 static void traverse(xmlNode *root);
1230
1231 static void traverse_properties(xmlNode *node)
1232 {
1233         xmlAttr *p;
1234
1235         for (p = node->properties; p; p = p->next)
1236                 traverse(p->children);
1237 }
1238
1239 static void visit(xmlNode *n)
1240 {
1241         visit_one_node(n);
1242         traverse_properties(n);
1243         traverse(n->children);
1244 }
1245
1246 static void suunto_importer(void)
1247 {
1248         import_source = SUUNTO;
1249         input_units = SI_units;
1250 }
1251
1252 static void uemis_importer(void)
1253 {
1254         import_source = UEMIS;
1255         input_units = SI_units;
1256 }
1257
1258 static void DivingLog_importer(void)
1259 {
1260         import_source = DIVINGLOG;
1261
1262         /*
1263          * Diving Log units are really strange.
1264          *
1265          * Temperatures are in C, except in samples,
1266          * when they are in Fahrenheit. Depths are in
1267          * meters, an dpressure is in PSI in the samples,
1268          * but in bar when it comes to working pressure.
1269          *
1270          * Crazy f*%^ morons.
1271          */
1272         input_units = SI_units;
1273 }
1274
1275 static void uddf_importer(void)
1276 {
1277         import_source = UDDF;
1278         input_units = SI_units;
1279         input_units.pressure = PASCAL;
1280         input_units.temperature = KELVIN;
1281 }
1282
1283 /*
1284  * I'm sure this could be done as some fancy DTD rules.
1285  * It's just not worth the headache.
1286  */
1287 static struct nesting {
1288         const char *name;
1289         void (*start)(void), (*end)(void);
1290 } nesting[] = {
1291         { "dive", dive_start, dive_end },
1292         { "Dive", dive_start, dive_end },
1293         { "sample", sample_start, sample_end },
1294         { "waypoint", sample_start, sample_end },
1295         { "SAMPLE", sample_start, sample_end },
1296         { "reading", sample_start, sample_end },
1297         { "event", event_start, event_end },
1298         { "gasmix", cylinder_start, cylinder_end },
1299         { "cylinder", cylinder_start, cylinder_end },
1300         { "P", sample_start, sample_end },
1301
1302         /* Import type recognition */
1303         { "SUUNTO", suunto_importer },
1304         { "Divinglog", DivingLog_importer },
1305         { "pre_dive", uemis_importer },
1306         { "uddf", uddf_importer },
1307
1308         { NULL, }
1309 };
1310
1311 static void traverse(xmlNode *root)
1312 {
1313         xmlNode *n;
1314
1315         for (n = root; n; n = n->next) {
1316                 struct nesting *rule = nesting;
1317
1318                 do {
1319                         if (!strcmp(rule->name, n->name))
1320                                 break;
1321                         rule++;
1322                 } while (rule->name);
1323
1324                 if (rule->start)
1325                         rule->start();
1326                 visit(n);
1327                 if (rule->end)
1328                         rule->end();
1329         }
1330 }
1331
1332 /* Per-file reset */
1333 static void reset_all(void)
1334 {
1335         /*
1336          * We reset the units for each file. You'd think it was
1337          * a per-dive property, but I'm not going to trust people
1338          * to do per-dive setup. If the xml does have per-dive
1339          * data within one file, we might have to reset it per
1340          * dive for that format.
1341          */
1342         input_units = SI_units;
1343         import_source = UNKNOWN;
1344 }
1345
1346 void parse_xml_file(const char *filename, GError **error)
1347 {
1348         xmlDoc *doc;
1349
1350         doc = xmlReadFile(filename, NULL, 0);
1351         if (!doc) {
1352                 fprintf(stderr, "Failed to parse '%s'.\n", filename);
1353                 if (error != NULL)
1354                 {
1355                         *error = g_error_new(g_quark_from_string("divelog"),
1356                                              DIVE_ERROR_PARSE,
1357                                              "Failed to parse '%s'",
1358                                              filename);
1359                 }
1360                 return;
1361         }
1362
1363         reset_all();
1364         dive_start();
1365         traverse(xmlDocGetRootElement(doc));
1366         dive_end();
1367         xmlFreeDoc(doc);
1368         xmlCleanupParser();
1369 }
1370
1371 void parse_xml_init(void)
1372 {
1373         LIBXML_TEST_VERSION
1374 }